·3세대 대형 기본 모델인 ChatGLM3는 중국어 그래픽과 텍스트에 대한 이해 능력을 향상시키고, 질문을 기반으로 인터넷에서 관련 정보를 자동으로 검색할 수 있는 비주얼 모드 GPT-4V를 목표로 합니다. 답변할 때 참고자료나 기사 링크를 제공하세요. 최종 테스트 모델 ChatGLM3-1.5B 및 ChatGLM3-3B는 vivo, Xiaomi, Samsung 휴대폰 및 차량 플랫폼을 지원합니다.
10월 27일 2023년 중국 컴퓨터 컨퍼런스에서 중국 인지 대형 모델 회사인 Beijing Zhipu Huazhang Technology Co., Ltd.(이하 "Zhipu AI")는 멀티 기능을 채택한 3세대 기반 대형 모델 ChatGLM3을 출시했습니다. -단계 강화된 예측 훈련 방법은 훈련을 더욱 완벽하게 만들고 ChatGLM3-1.5B 및 ChatGLM3-3B를 휴대폰에 배포하여 vivo, Xiaomi 및 Samsung을 포함한 여러 휴대폰 및 차량 탑재 플랫폼을 지원할 수 있습니다.
시각 모드 GPT-4V를 목표로 ChatGLM3은 10개 이상의 국제 표준 이미지 및 텍스트 평가 데이터 세트에서 SOTA(최고 성능)를 달성한 CogVLM의 다중 모드 이해 기능을 포함하여 여러 가지 새로운 기능의 반복적인 업그레이드를 구현했습니다. , 최첨단). CogVLM 모델은 중국어 그래픽과 텍스트에 대한 이해를 향상시키고 복잡한 대상 감지를 완료하고 레이블을 지정하여 자동 데이터 주석을 완료할 수 있습니다. 재료 사진을 바탕으로 조리법을 제공하고 대담 자의 취향에 맞게 조정할 수 있습니다.
재료 사진을 바탕으로 레시피가 제공됩니다.
Zhipu AI의 CEO인 Zhang Peng은 The Paper(www.thepaper.cn)와 인터뷰에서 다중 모드 대형 모델이 음성, 시각 및 자연어에 대한 대화형 인식에서 많은 구체적인 진전을 이루었다고 말했습니다. -모달 대형 모델은 더 중요한 단계로 나아갈 것이며 더 많은 모달 데이터가 통합될 수 있으며 다중 모드 사전 훈련은 대형 모델의 지능 또는 인지 능력을 더욱 향상시킬 것입니다.
사진 내용 분석 기능.
ChatGLM3의 코드 향상 모듈인 Code Interpreter는 사용자 요구에 따라 코드를 생성 및 실행하여 데이터 분석, 파일 처리 등 복잡한 작업을 자동으로 완료합니다. "코드" 기능은 현재 이미지 처리, 수학적 계산, 데이터 분석 및 기타 사용 시나리오를 지원합니다.
사용자 요구에 따라 코드를 생성하고 실행합니다.
웹 검색 강화 WebGLM 접근 검색 강화는 질문을 기반으로 인터넷에서 관련 정보를 자동으로 검색하고 답변 시 참고 자료나 기사 링크를 제공할 수 있습니다.
ChatGLM3는 AgentTuning 기술을 통합하고 모델 에이전트 기능을 활성화하며 국내 대형 모델이 도구 호출, 코드 실행, 게임, 데이터베이스 작업, 지식 그래프 검색 및 추론, 운영 체제 및 기타 시나리오를 기본적으로 지원할 수 있도록 합니다.
현재 ChatGLM3는 휴대폰에 배포할 수 있는 최종 테스트 모델 ChatGLM3-1.5B 및 ChatGLM3-3B를 출시했습니다. 이들은 vivo, Xiaomi 및 Samsung을 포함한 다양한 휴대폰 및 차량 탑재 플랫폼을 지원합니다. 20개 토큰/초의 속도로 모바일 플랫폼의 CPU 칩.
최종 테스트 모델 ChatGLM3-1.5B 및 ChatGLM3-3B는 vivo, Xiaomi, Samsung 휴대폰 및 차량 플랫폼을 지원합니다.
Zhang Peng은 2022년 초부터 Zhipu AI가 출시한 GLM 시리즈 모델이 Ascend, Sunway Supercomputing 및 Haiguang DCU 아키텍처에 대한 대규모 사전 훈련 및 추론을 지원했다고 말했습니다. 현재 Zhipu AI의 제품은 10개 이상의 국내 하드웨어 생태계를 지원했으며, 국내 칩 회사와의 공동 혁신은 국내 토종 대형 모델 및 국산 칩 개발에 도움이 될 것입니다.
위 내용은 Zhipu AI, 국산 칩에 맞춘 3세대 대형 기본 모델 출시의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!