> 기술 주변기기 > 일체 포함 > Zhipu AI, 국산 칩에 맞춘 3세대 대형 기본 모델 출시

Zhipu AI, 국산 칩에 맞춘 3세대 대형 기본 모델 출시

WBOY
풀어 주다: 2023-10-27 20:21:04
앞으로
478명이 탐색했습니다.

·3세대 대형 기본 모델인 ChatGLM3는 중국어 그래픽과 텍스트에 대한 이해 능력을 향상시키고, 질문을 기반으로 인터넷에서 관련 정보를 자동으로 검색할 수 있는 비주얼 모드 GPT-4V를 목표로 합니다. 답변할 때 참고자료나 기사 링크를 제공하세요. 최종 테스트 모델 ChatGLM3-1.5B 및 ChatGLM3-3B는 vivo, Xiaomi, Samsung 휴대폰 및 차량 플랫폼을 지원합니다.

10월 27일 2023년 중국 컴퓨터 컨퍼런스에서 중국 인지 대형 모델 회사인 Beijing Zhipu Huazhang Technology Co., Ltd.(이하 "Zhipu AI")는 멀티 기능을 채택한 3세대 기반 대형 모델 ChatGLM3을 출시했습니다. -단계 강화된 예측 훈련 방법은 훈련을 더욱 완벽하게 만들고 ChatGLM3-1.5B 및 ChatGLM3-3B를 휴대폰에 배포하여 vivo, Xiaomi 및 Samsung을 포함한 여러 휴대폰 및 차량 탑재 플랫폼을 지원할 수 있습니다.

시각 모드 GPT-4V를 목표로 ChatGLM3은 10개 이상의 국제 표준 이미지 및 텍스트 평가 데이터 세트에서 SOTA(최고 성능)를 달성한 CogVLM의 다중 모드 이해 기능을 포함하여 여러 가지 새로운 기능의 반복적인 업그레이드를 구현했습니다. , 최첨단). CogVLM 모델은 중국어 그래픽과 텍스트에 대한 이해를 향상시키고 복잡한 대상 감지를 완료하고 레이블을 지정하여 자동 데이터 주석을 완료할 수 있습니다. 재료 사진을 바탕으로 조리법을 제공하고 대담 자의 취향에 맞게 조정할 수 있습니다.

Zhipu AI, 국산 칩에 맞춘 3세대 대형 기본 모델 출시

재료 사진을 바탕으로 레시피가 제공됩니다.

Zhipu AI의 CEO인 Zhang Peng은 The Paper(www.thepaper.cn)와 인터뷰에서 다중 모드 대형 모델이 음성, 시각 및 자연어에 대한 대화형 인식에서 많은 구체적인 진전을 이루었다고 말했습니다. -모달 대형 모델은 더 중요한 단계로 나아갈 것이며 더 많은 모달 데이터가 통합될 수 있으며 다중 모드 사전 훈련은 대형 모델의 지능 또는 인지 능력을 더욱 향상시킬 것입니다.

Zhipu AI, 국산 칩에 맞춘 3세대 대형 기본 모델 출시

사진 내용 분석 기능.

ChatGLM3의 코드 향상 모듈인 Code Interpreter는 사용자 요구에 따라 코드를 생성 및 실행하여 데이터 분석, 파일 처리 등 복잡한 작업을 자동으로 완료합니다. "코드" 기능은 현재 이미지 처리, 수학적 계산, 데이터 분석 및 기타 사용 시나리오를 지원합니다.

Zhipu AI, 국산 칩에 맞춘 3세대 대형 기본 모델 출시

사용자 요구에 따라 코드를 생성하고 실행합니다.

웹 검색 강화 WebGLM 접근 검색 강화는 질문을 기반으로 인터넷에서 관련 정보를 자동으로 검색하고 답변 시 참고 자료나 기사 링크를 제공할 수 있습니다.

ChatGLM3는 AgentTuning 기술을 통합하고 모델 에이전트 기능을 활성화하며 국내 대형 모델이 도구 호출, 코드 실행, 게임, 데이터베이스 작업, 지식 그래프 검색 및 추론, 운영 체제 및 기타 시나리오를 기본적으로 지원할 수 있도록 합니다.

현재 ChatGLM3는 휴대폰에 배포할 수 있는 최종 테스트 모델 ChatGLM3-1.5B 및 ChatGLM3-3B를 출시했습니다. 이들은 vivo, Xiaomi 및 Samsung을 포함한 다양한 휴대폰 및 차량 탑재 플랫폼을 지원합니다. 20개 토큰/초의 속도로 모바일 플랫폼의 CPU 칩.

Zhipu AI, 국산 칩에 맞춘 3세대 대형 기본 모델 출시

최종 테스트 모델 ChatGLM3-1.5B 및 ChatGLM3-3B는 vivo, Xiaomi, Samsung 휴대폰 및 차량 플랫폼을 지원합니다.

Zhang Peng은 2022년 초부터 Zhipu AI가 출시한 GLM 시리즈 모델이 Ascend, Sunway Supercomputing 및 Haiguang DCU 아키텍처에 대한 대규모 사전 훈련 및 추론을 지원했다고 말했습니다. 현재 Zhipu AI의 제품은 10개 이상의 국내 하드웨어 생태계를 지원했으며, 국내 칩 회사와의 공동 혁신은 국내 토종 대형 모델 및 국산 칩 개발에 도움이 될 것입니다.

위 내용은 Zhipu AI, 국산 칩에 맞춘 3세대 대형 기본 모델 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

원천:sohu.com
본 웹사이트의 성명
본 글의 내용은 네티즌들의 자발적인 기여로 작성되었으며, 저작권은 원저작자에게 있습니다. 본 사이트는 이에 상응하는 법적 책임을 지지 않습니다. 표절이나 침해가 의심되는 콘텐츠를 발견한 경우 admin@php.cn으로 문의하세요.
인기 튜토리얼
더>
최신 다운로드
더>
웹 효과
웹사이트 소스 코드
웹사이트 자료
프론트엔드 템플릿