7월 5일, 2024년 세계 인공지능 컨퍼런스의 "신뢰할 수 있는 대형 모델이 산업 혁신과 개발에 도움이 됩니다" 포럼에서 Ant Group은 자체 개발한 Bailing 모델의 최신 개발 진행 상황을 발표했습니다. " '듣기', '말하기', '그림 그리기'라는 기본 다중 모드 기능을 통해 오디오, 비디오, 사진, 텍스트 등 다중 모드 데이터를 직접 이해하고 훈련할 수 있습니다. 기본 다중 방식은 AGI를 구현하는 유일한 방법으로 간주되며, 중국에서는 소수의 대형 모델 제조업체만이 이 기능을 달성했습니다. 기자는 컨퍼런스 시연을 통해 대형 모델이 인간처럼 인식하고 상호 작용할 수 있도록 하여 지능형 신체 경험의 업그레이드를 지원하는 Bailing의 다중 모드 기능이 'Alipay 지능형 보조자'에 적용되었음을 확인했습니다. 앞으로는 Alipay에서 더욱 지능적인 에이전트 업그레이드를 지원하세요.
1 (Ant Group 부사장 Xu Peng이 Bailing Large Model의 기본 다중 모드 기능을 소개했습니다.)런칭 현장에서 Ant Group의 Xu Peng 부사장은 새로 업그레이드된 멀티 모드보다 더 많은 응용 시나리오를 시연했습니다. 기술은 다음을 달성할 수 있습니다.
Bailing의 대형 모델의 다중 모드 기능을 기반으로 Ant Group은 업계에서 대규모 애플리케이션 착륙 사례를 탐색해 왔습니다.
포럼에 동시에 공개된 '알리페이 멀티모달 의료모델'은 이러한 탐구의 실천이다. Alipay의 다중 모드 의료 모델에는 보고서, 이미지, 의약품 및 기타 다중 모드 정보를 포함하여 수백억 개의 중국어 및 영어 그래픽과 텍스트, 수천억 개의 의료 텍스트 코퍼스 및 수천만 개의 고급 정보가 추가된 것으로 이해됩니다. , 전문적인 의학 지식을 보유하고 있으며 중국 의학 LLM 평가 목록인 프롬프트CBLUE에서 A 목록 1위, B 목록 2위를 차지했습니다.
Bailing 대형 모델의 다중 모드 기능을 기반으로 Ant Group과 우한 대학교가 공동 개발한 원격 감지 모델인 SkySense도 포럼에서 오픈 소스 계획을 발표했습니다. SkySense는 현재 가장 큰 매개변수 규모, 가장 포괄적인 작업 범위 및 가장 높은 인식 정확도를 갖춘 다중 모드 원격 감지 기본 모델입니다.
"단일 텍스트 의미 이해부터 다중 모드 기능까지, 이는 인공 지능 기술의 핵심 반복이며, 다중 모드 기술로 생성된 '보고, 듣고, 쓰고, 그리기'의 응용 시나리오는 AI 성능을 더욱 향상시킬 것입니다. 현실적으로 인간에게 더 가까워지기 위해 Ant는 기본 다중 양식 기술의 연구 개발에 계속 투자할 것입니다.”라고 Xu Peng은 말했습니다.
위 내용은 Ant Bailing 대형 모델의 최신 진행 상황: 이미 기본 다중 모드 기능을 갖추고 있습니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!