목차
대형 모델 도구 학습을 빠르게 포함
벽돌파를 선도하는 최초의 온라인 지원 중국어 질의응답 모델
높은 수준에서 국내 대형 모델 시스템 구축에 최선을 다하고 있습니다.
기술 주변기기 일체 포함 'ChatGPT 플러그인 시스템'의 국내 오픈소스 버전이 출시되었습니다! Douban과 검색이 모두 가능하며 Tsinghua University, Face Wall Intelligence 등이 공동 출시했습니다.

'ChatGPT 플러그인 시스템'의 국내 오픈소스 버전이 출시되었습니다! Douban과 검색이 모두 가능하며 Tsinghua University, Face Wall Intelligence 등이 공동 출시했습니다.

May 24, 2023 pm 02:25 PM
플러그인 오픈 소스

최근 "ChatGPT Plugins Domestic Alternative System"이라는 오픈소스 프로젝트가 GitHub에서 별이 급격히 늘었습니다.

이 프로젝트는 Wallface Intelligence에서 개발한 대형 모델 도구 학습 엔진인 BMTools입니다.

ChatGPT 플러그인 시스템의 국내 오픈소스 버전이 출시되었습니다! Douban과 검색이 모두 가능하며 Tsinghua University, Face Wall Intelligence 등이 공동 출시했습니다.

프로젝트 주소: https://www.php.cn/link/a330f9fecc388ce67f87b09855480ca3

대형 모델 도구 학습을 빠르게 포함

먼저, 가장 중요한 질문입니다. BMTools의 장점은 무엇입니까?

Wallface R&D 팀은 언어 모델 기반의 오픈 소스 확장 가능한 도구 학습 플랫폼으로 다양한 도구 호출 프로세스를 BMTools 프레임워크로 통합하여 전체 도구 호출 프로세스를 표준화하고 자동화했습니다.

현재 BMTools에서 지원하는 플러그인은 douban-film(두반 영화), 검색(Bing 검색), Klarna(쇼핑) 등을 포함하여 엔터테인먼트, 학술, 생활 및 기타 측면을 다룹니다.

개발자는 BMTools를 사용하여 특정 모델(예: ChatGPT, GPT-4)을 사용하여 다양한 도구 인터페이스를 호출하여 특정 기능을 구현할 수 있습니다.

또한 BMTools 툴킷에는 최근 인기 있는 Auto-GPT 및 BabyAGI도 통합되어 있습니다.

ChatGPT 플러그인 시스템의 국내 오픈소스 버전이 출시되었습니다! Douban과 검색이 모두 가능하며 Tsinghua University, Face Wall Intelligence 등이 공동 출시했습니다.

그러면 이런 종류의 도구 학습은 대형 모델에 어떤 역할을 할까요?

대형 모델이 여러 측면에서 놀라운 성과를 거두었지만 특정 분야의 작업에는 여전히 일정한 한계가 있습니다. 이러한 작업을 효과적으로 해결하려면 전문 도구나 도메인 지식이 필요한 경우가 많습니다.

따라서 스마트폰이 더 나은 사용자 경험을 위해 앱을 다운로드해야 하는 것처럼 대형 모델은 실제 작업에 대한 보다 포괄적인 지원을 제공하기 위해 다양한 전문 도구를 호출할 수 있는 기능이 필요합니다.

대형모델의 새로운 패러다임, Tool Learning이 탄생했습니다. 이 패러다임의 핵심은 문제 해결의 정확성, 효율성 및 자율성을 높이기 위해 기본 모델의 강점과 특수 도구를 융합하는 것입니다.

대형 모델과 외부 도구의 유기적인 결합은 이전 역량의 많은 단점을 성공적으로 보완했으며, 도구 학습은 대형 모델의 잠재력을 크게 발휘했습니다.

ChatGPT 플러그인 시스템의 국내 오픈소스 버전이 출시되었습니다! Douban과 검색이 모두 가능하며 Tsinghua University, Face Wall Intelligence 등이 공동 출시했습니다.

문서 주소: https://arxiv.org/abs/2304.08354

2023년 3월 23일, OpenAI는 플러그인 시스템(Plugins) 출시를 발표했습니다. 역량은 우리가 도구적 학습이라고 부르는 것입니다.

도구 학습 지원을 통해 플러그인은 ChatGPT를 지원하여 브라우저, 수학적 계산 및 기타 외부 도구를 연결하여 기능을 크게 향상시킬 수 있습니다.

ChatGPT 플러그인의 등장으로 ChatGPT의 마지막 단점이 보완되어 네트워킹을 지원하고 수학적 계산을 해결할 수 있게 되었습니다. 이를 OpenAI의 "App Store" 순간이라고 합니다. 그러나 지금까지는 OpenAI Plus 사용자에게만 지원되었으며 대부분의 개발자는 사용할 수 없는 상태였습니다.

ChatGPT 플러그인 시스템의 국내 오픈소스 버전이 출시되었습니다! Douban과 검색이 모두 가능하며 Tsinghua University, Face Wall Intelligence 등이 공동 출시했습니다.

Mianbi가 ChatGPT 플러그인 출시 후 10일 만에 BMTools를 시작할 수 있는 이유는 무엇입니까?

Facing Wall Intelligence는 대형 모델의 전 과정에 효율적인 컴퓨팅 도구 개발에 주력해 왔습니다. R&D팀은 2022년부터 기존 언어 모델과 언어 모델의 결합을 시도하며 도구 학습의 새로운 패러다임에 대한 연구를 계속해 왔습니다. 검색 엔진, 지식 기반 및 기타 도구를 통해 좋은 실험 결과를 얻었습니다. 또한 팀은 도구 학습이라는 최첨단 연구 분야에서 유익한 탐구를 수행했습니다.

OpenAI 플러그인의 성능에 대한 많은 개발자들의 간절한 기대를 충족시키기 위해 팀에서는 초기 축적을 바탕으로 관련 연구 결과를 신속하게 툴링하여 툴킷 BMTools에 축적했습니다. 도구 학습은 벽면 지능형 대형 모델 기능 시스템에 내장되어 OpenBMB 대형 모델 도구 시스템 "Family Bucket"에 공식적으로 합류합니다.

도구 학습도 효율적인 훈련, 미세 조정, 추론 및 압축 제품군을 거쳐 Wallface Intelligence가 출시한 또 다른 걸작입니다.

ChatGPT 플러그인 시스템의 국내 오픈소스 버전이 출시되었습니다! Douban과 검색이 모두 가능하며 Tsinghua University, Face Wall Intelligence 등이 공동 출시했습니다.

BMTools 툴킷: https://www.php.cn/link/a330f9fecc388ce67f87b09855480ca3

벽돌파를 선도하는 최초의 온라인 지원 중국어 질의응답 모델

최근 Wall-Facing Intelligence는 Tsinghua University, 전국인민대표대회, Tencent 연구진과 함께 중국 분야 최초의 대화형 웹 검색 기반 오픈 소스 질문 및 답변 모델 프레임워크인 WebCPM을 공동 출시했습니다. 이번 사업으로 국내 대형 모델 분야의 공백을 메웠다. 그리고 WebCPM은 BMTools의 성공적인 실행입니다.

현재 WebCPM 관련 작업은 자연어 처리 분야 최고의 컨퍼런스인 ACL 2023에 채택되었습니다.

WebCPM 문서 링크: https://arxiv.org/abs/2305.06849

WebCPM 데이터 및 코드 링크: https://github.com/thunlp/WebCPM

할 수 있습니다. ChatGPT가 인기를 얻은 이후 중국에서는 다양한 세력의 대형 모델이 생겨났지만 대부분의 모델이 인터넷에 연결되어 있지 않습니다.

인터넷에 연결되지 않은 대형 모델은 최신 정보를 얻을 수 없으며, 생성된 콘텐츠는 오래된 데이터 세트를 기반으로 하기 때문에 특정 제한이 있습니다.

WebCPM의 특징은 정보 검색이 대화형 웹 검색을 기반으로 한다는 것입니다. 인간과 같은 검색 엔진과 상호 작용하여 질문에 답변하고 답변을 생성하는 데 필요한 사실 지식을 수집할 수 있습니다.

즉, 인터넷 기능의 지원으로 대형 모델의 질문에 대한 실시간 답변의 정확성이 크게 향상되었습니다.

ChatGPT 플러그인 시스템의 국내 오픈소스 버전이 출시되었습니다! Douban과 검색이 모두 가능하며 Tsinghua University, Face Wall Intelligence 등이 공동 출시했습니다.

WebCPM 모델 프레임워크

WebCPM 벤치마크는 WebGPT이며, 이는 Microsoft가 최근 출시한 New Bing의 차세대 검색 기술이기도 합니다.

WebGPT와 마찬가지로 WebCPM은 전통적인 LFQA(Long-form Question Answering) 긴 텍스트 개방형 질문 및 답변 패러다임의 단점을 극복합니다.: 비대화형 검색 방법에 의존합니다. 정보를 검색하는 쿼리문입니다.

WebCPM 프레임워크에서 모델은 실시간으로 검색 엔진과 상호 작용하여 웹 검색을 수행함으로써 인간과 같은 고품질 정보를 선별할 수 있습니다.

그뿐만 아니라, 모델은 복잡한 문제에 직면하면 인간처럼 여러 하위 문제로 분해하고 순차적으로 질문합니다.

또한, 관련 정보를 식별하고 탐색함으로써 모델은 원래 문제에 대한 이해를 점차 향상시키고, 지속적으로 새로운 질문을 쿼리하여 보다 다양한 정보를 검색하게 됩니다.

ChatGPT 플러그인 시스템의 국내 오픈소스 버전이 출시되었습니다! Douban과 검색이 모두 가능하며 Tsinghua University, Face Wall Intelligence 등이 공동 출시했습니다.

WebCPM 검색 대화형 인터페이스

앞으로 벽을 향한 지능은 과학 연구 결과의 적용 및 변형을 더욱 촉진하고 WebCPM 대형 모델의 구현을 촉진하기 위해 노력할 것입니다. 해당 필드.

높은 수준에서 국내 대형 모델 시스템 구축에 최선을 다하고 있습니다.

Wall-face Intelligence는 항상 대형 모델의 원천적 혁신을 주도하기 위해 노력해 왔으며, 지능형 시대에 맞는 대형 모델 인프라 구축과 궁극적으로 "수천 가구에 대형 모델이 날아오도록" 실현하기 위해 국내 대형 모델 시스템을 구축합니다.

벽면 지능의 결과는 모두에게 명백하며 업계에서도 인정받았습니다.

Zhihu 최고 기술 책임자 Li Dahai는 Wall-Facing Intelligence에 대해 다음과 같이 언급한 적이 있습니다. "Wall-Facing Intelligence 팀은 대규모 언어 모델 연구를 수행하는 중국 최초의 팀입니다. 회사는 다음과 같은 풀 스택 기술 역량을 보유하고 있습니다. Zhihu는 Wall-facing Intelligence가 인프라의 핵심 제조업체로 성장할 수 있다고 믿습니다. 중국 대형 모델 분야에서 중국 대형 모델 산업에 기여합니다.

ChatGPT 플러그인 시스템의 국내 오픈소스 버전이 출시되었습니다! Douban과 검색이 모두 가능하며 Tsinghua University, Face Wall Intelligence 등이 공동 출시했습니다.

벽면 스마트 파노라마

도구 플랫폼과 대형 모델 라이브러리를 바탕으로 회사는 ModelForce 대형 모델 시스템과 CPM 엔터프라이즈급 대형 모델을 출시했습니다. 대형 모델 기반의 AI 생산성 플랫폼인 ModelForce에는 대형 모델 훈련, 미세 조정, 압축, 추론의 전 과정을 위한 효율적인 컴퓨팅 도구 시스템이 내장되어 있습니다.

샘플이 적고 샘플이 없는 대형 모델의 일반적인 기능을 기반으로 플랫폼은 대형 모델에 대해 표준화된 미세 조정 방법을 사용하고 제로 코드 미세 조정 클라이언트를 생성하여 데이터 주석 비용, 컴퓨팅 성능을 크게 줄일 수 있습니다. AI R&D 과정에 드는 비용, 인건비.

CPM Large Model Enterprise Edition은 오픈 소스 버전 모델의 기능을 업그레이드했으며 다중 기능 통합, 점진적인 미세 조정 및 유연한 적응, 다중 시나리오 적용의 특징을 가지고 있습니다.

CPM 엔터프라이즈급 대형 모델과 ModelForce 대형 모델 시스템을 기반으로 Wallface Intelligence는 Zhihu와 협력하여 "Zhihaitu AI" 대형 모델을 훈련했습니다.

요소를 빠르게 추출하고, 의견을 정리하고, 콘텐츠를 집계할 수 있는 Zhihu Hot List에 "Zhihaitu AI" 대형 모델이 적용되었습니다. 4월 23일 Zhihu Discovery Conference에서 공개되었습니다.

여기서 끝나지 않습니다. 실제로 Wall-facing Intelligence는 상위 대학의 학문적 연구력을 통합하고 지속적으로 대규모 구축 및 운영을 통해 "삼위일체" 대규모 모델 산학연 생태 패턴을 성공적으로 만들었습니다. 모델 오픈 소스 커뮤니티 OpenBMB, Wall-facing Intelligence는 업계 요구 사항을 구축했으며, 알고리즘 오픈 소스와 산업 구현 간의 폐쇄 루프 채널을 통해 국내 대규모 분야의 최첨단 연구, 응용 연구 개발 및 산업 발전을 촉진하기 위해 노력하고 있습니다. 모델.

ChatGPT 플러그인 시스템의 국내 오픈소스 버전이 출시되었습니다! Douban과 검색이 모두 가능하며 Tsinghua University, Face Wall Intelligence 등이 공동 출시했습니다.

  • OpenBMB 오픈소스 커뮤니티

는 국내 대형모델 오픈소스 생태계 구축에 기여하고 있으며, OpenPrompt, OpenDelta, BMInf 등 대형모델 풀모델 시리즈를 출시해왔습니다. , BMCook, BMTrain, BMTools 등 프로세스 오픈 소스 툴킷과 모든 사람을 위한 대규모 모델 공개 코스가 Zhihu, Bilibili 및 기타 플랫폼에서 출시되었습니다.

  • 칭화대학교 컴퓨터과학과 자연어처리 및 사회인문 컴퓨팅 연구실(THUNLP)

대학 내에서 독보적인 연구력으로 1970년대에 설립되어 최초로 중국의 NLP 연구 이는 가장 초기이자 가장 영향력 있는 과학 연구 단위로 많은 유명 학자와 과학자들이 활동하고 있으며 대규모 언어 모델 분야에서의 연구 활동은 매우 뛰어납니다.

  • Facing the Wall Intelligence

는 인공 지능의 일반적인 시나리오 및 분야에서 대형 모델을 적용하고 구현하는 데 전념하고 있습니다. CPM 대형 모델은 자체 개발한 사전 학습 언어 모듈입니다. Facing the Wall 팀은 다년간의 대규모 모델 훈련 경험을 바탕으로 제작되었습니다. 회사는 현재 엔젤 라운드 파이낸싱에서 수천만 위안을 완료했으며 많은 유명 기관과 전략적 협력을 달성했습니다.


국내 대형 모델 시스템을 구축하기 위해 노력하는 과정에서 Wallface Intelligence의 비전은 항상 대형 모델 구현을 통해 더 많은 산업에 힘을 실어주고 더 많은 기업과 개인에게 혜택을 주는 것이었습니다.

불꽃이 초원의 불길을 일으켰고, 대형 모델들이 더 많은 분야에서 잠재력을 발휘하며 놀라운 활용 가치를 선보일 것을 기대합니다.

위 내용은 'ChatGPT 플러그인 시스템'의 국내 오픈소스 버전이 출시되었습니다! Douban과 검색이 모두 가능하며 Tsinghua University, Face Wall Intelligence 등이 공동 출시했습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.

핫 AI 도구

Undresser.AI Undress

Undresser.AI Undress

사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover

AI Clothes Remover

사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool

Undress AI Tool

무료로 이미지를 벗다

Clothoff.io

Clothoff.io

AI 옷 제거제

Video Face Swap

Video Face Swap

완전히 무료인 AI 얼굴 교환 도구를 사용하여 모든 비디오의 얼굴을 쉽게 바꾸세요!

뜨거운 도구

메모장++7.3.1

메모장++7.3.1

사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전

SublimeText3 중국어 버전

중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기

스튜디오 13.0.1 보내기

강력한 PHP 통합 개발 환경

드림위버 CS6

드림위버 CS6

시각적 웹 개발 도구

SublimeText3 Mac 버전

SublimeText3 Mac 버전

신 수준의 코드 편집 소프트웨어(SublimeText3)

10가지 권장 오픈 소스 무료 텍스트 주석 도구 10가지 권장 오픈 소스 무료 텍스트 주석 도구 Mar 26, 2024 pm 08:20 PM

텍스트 주석은 텍스트의 특정 내용에 해당하는 레이블이나 태그를 추가하는 작업입니다. 주요 목적은 특히 인공 지능 분야에서 더 심층적인 분석 및 처리를 위해 텍스트에 추가 정보를 제공하는 것입니다. 텍스트 주석은 인공 지능 애플리케이션의 지도형 기계 학습 작업에 매우 중요합니다. 자연어 텍스트 정보를 보다 정확하게 이해하고 텍스트 분류, 감정 분석, 언어 번역 등의 작업 성능을 향상시키기 위해 AI 모델을 훈련하는 데 사용됩니다. 텍스트 주석을 통해 우리는 AI 모델이 텍스트의 개체를 인식하고, 맥락을 이해하고, 새로운 유사한 데이터가 나타날 때 정확한 예측을 하도록 가르칠 수 있습니다. 이 기사에서는 주로 더 나은 오픈 소스 텍스트 주석 도구를 권장합니다. 1.라벨스튜디오https://github.com/Hu

15가지 추천 오픈 소스 무료 이미지 주석 도구 15가지 추천 오픈 소스 무료 이미지 주석 도구 Mar 28, 2024 pm 01:21 PM

이미지 주석은 이미지 콘텐츠에 더 깊은 의미와 설명을 제공하기 위해 이미지에 레이블이나 설명 정보를 연결하는 프로세스입니다. 이 프로세스는 비전 모델을 훈련하여 이미지의 개별 요소를 보다 정확하게 식별하는 데 도움이 되는 기계 학습에 매우 중요합니다. 이미지에 주석을 추가함으로써 컴퓨터는 이미지 뒤의 의미와 맥락을 이해할 수 있으므로 이미지 내용을 이해하고 분석하는 능력이 향상됩니다. 이미지 주석은 컴퓨터 비전, 자연어 처리, 그래프 비전 모델 등 다양한 분야를 포괄하여 차량이 도로의 장애물을 식별하도록 지원하는 등 광범위한 애플리케이션을 보유하고 있습니다. 의료영상인식을 통한 질병진단. 이 기사에서는 주로 더 나은 오픈 소스 및 무료 이미지 주석 도구를 권장합니다. 1.마케센스

PyCharm 초보자 가이드: 플러그인 설치에 대한 전반적인 이해! PyCharm 초보자 가이드: 플러그인 설치에 대한 전반적인 이해! Feb 25, 2024 pm 11:57 PM

PyCharm은 개발자가 코드를 보다 효율적으로 작성할 수 있도록 다양한 기능과 도구를 제공하는 강력하고 인기 있는 Python 통합 개발 환경(IDE)입니다. PyCharm의 플러그인 메커니즘은 기능을 확장하기 위한 강력한 도구입니다. 다양한 플러그인을 설치하면 PyCharm에 다양한 기능과 사용자 정의 기능을 추가할 수 있습니다. 따라서 PyCharm을 처음 접하는 사람이 플러그인을 이해하고 능숙하게 설치하는 것이 중요합니다. 이 문서에서는 PyCharm 플러그인의 전체 설치에 대해 자세히 소개합니다.

Illustrator에서 플러그인 로드 중 오류 발생 [수정됨] Illustrator에서 플러그인 로드 중 오류 발생 [수정됨] Feb 19, 2024 pm 12:00 PM

Adobe Illustrator를 시작할 때 플러그인 로딩 오류에 대한 메시지가 팝업됩니까? 일부 Illustrator 사용자는 응용 프로그램을 열 때 이 오류가 발생했습니다. 메시지 뒤에는 문제가 있는 플러그인 목록이 표시됩니다. 이 오류 메시지는 설치된 플러그인에 문제가 있음을 나타내지만 손상된 Visual C++ DLL 파일이나 손상된 기본 설정 파일과 같은 다른 이유로 인해 발생할 수도 있습니다. 이 오류가 발생하면 이 문서에서 문제 해결 방법을 안내하므로 아래 내용을 계속 읽어보세요. Illustrator에서 플러그인 로드 오류 Adobe Illustrator를 시작하려고 할 때 "플러그인 로드 오류" 오류 메시지가 표시되면 다음을 사용할 수 있습니다. 관리자로

Edge 브라우저가 이 플러그인을 지원하지 않는 이유에 대한 세 가지 해결 방법을 공유하세요. Edge 브라우저가 이 플러그인을 지원하지 않는 이유에 대한 세 가지 해결 방법을 공유하세요. Mar 13, 2024 pm 04:34 PM

사용자가 Edge 브라우저를 사용할 때 더 많은 요구 사항을 충족하기 위해 일부 플러그인을 추가할 수 있습니다. 그런데 플러그인을 추가하면 해당 플러그인이 지원되지 않는다고 표시됩니다. 이 문제를 해결하는 방법은 무엇입니까? 오늘은 에디터가 세 가지 해결 방법을 알려드리겠습니다. 방법 1: 다른 브라우저를 사용해 보세요. 방법 2: 브라우저의 Flash Player가 오래되었거나 누락되어 플러그인이 지원되지 않을 수 있습니다. 공식 웹사이트에서 최신 버전을 다운로드할 수 있습니다. 방법 3: "Ctrl+Shift+Delete" 키를 동시에 누르세요. "데이터 지우기"를 클릭하고 브라우저를 다시 엽니다.

권장 사항: 우수한 JS 오픈 소스 얼굴 감지 및 인식 프로젝트 권장 사항: 우수한 JS 오픈 소스 얼굴 감지 및 인식 프로젝트 Apr 03, 2024 am 11:55 AM

얼굴 검출 및 인식 기술은 이미 상대적으로 성숙하고 널리 사용되는 기술입니다. 현재 가장 널리 사용되는 인터넷 응용 언어는 JS입니다. 웹 프런트엔드에서 얼굴 감지 및 인식을 구현하는 것은 백엔드 얼굴 인식에 비해 장점과 단점이 있습니다. 장점에는 네트워크 상호 작용 및 실시간 인식이 줄어 사용자 대기 시간이 크게 단축되고 사용자 경험이 향상된다는 단점이 있습니다. 모델 크기에 따라 제한되고 정확도도 제한됩니다. js를 사용하여 웹에서 얼굴 인식을 구현하는 방법은 무엇입니까? 웹에서 얼굴 인식을 구현하려면 JavaScript, HTML, CSS, WebRTC 등 관련 프로그래밍 언어 및 기술에 익숙해야 합니다. 동시에 관련 컴퓨터 비전 및 인공지능 기술도 마스터해야 합니다. 웹 측면의 디자인으로 인해 주목할 가치가 있습니다.

Chrome 플러그인 확장 프로그램 설치 디렉터리는 무엇인가요? Chrome 플러그인 확장 프로그램 설치 디렉터리는 무엇인가요? Mar 08, 2024 am 08:55 AM

Chrome 플러그인 확장 프로그램 설치 디렉터리는 무엇인가요? 일반적인 상황에서 Chrome 플러그인 확장의 기본 설치 디렉터리는 다음과 같습니다. 1. windowsxp에서 Chrome 플러그인의 기본 설치 디렉터리 위치: C:\DocumentsandSettings\username\LocalSettings\ApplicationData\Google\Chrome\UserData\ Windows7의 Default\Extensions2.chrome 플러그인의 기본 설치 디렉터리 위치: C:\Users\username\AppData\Local\Google\Chrome\User

대형 모델을 이해하는 Alibaba 7B 다중 모드 문서, 새로운 SOTA 획득 대형 모델을 이해하는 Alibaba 7B 다중 모드 문서, 새로운 SOTA 획득 Apr 02, 2024 am 11:31 AM

다중 모드 문서 이해 기능을 위한 새로운 SOTA! Alibaba mPLUG 팀은 최신 오픈 소스 작업인 mPLUG-DocOwl1.5를 출시했습니다. 이 작품은 고해상도 이미지 텍스트 인식, 일반 문서 구조 이해, 지침 따르기, 외부 지식 도입이라는 4가지 주요 과제를 해결하기 위한 일련의 솔루션을 제안했습니다. 더 이상 고민하지 말고 먼저 효과를 살펴보겠습니다. 복잡한 구조의 차트도 한 번의 클릭으로 인식하고 마크다운 형식으로 변환 가능: 다양한 스타일의 차트 사용 가능: 보다 자세한 텍스트 인식 및 위치 지정도 쉽게 처리 가능: 문서 이해에 대한 자세한 설명도 제공 가능: 아시다시피, " 문서 이해"는 현재 대규모 언어 모델 구현을 위한 중요한 시나리오입니다. 시장에는 문서 읽기를 지원하는 많은 제품이 있습니다. 그 중 일부는 주로 텍스트 인식을 위해 OCR 시스템을 사용하고 텍스트 처리를 위해 LLM을 사용합니다.

See all articles