11월 10일 오후, 중국 통신 인공 지능 총괄 책임자 He Zhongjiang이 인공 지능 및 데이터 산업 개발 협력 포럼에서 일반 대형 모델의 제품과 아이디어를 설명했습니다
He Zhongjiang은 먼저 일반 인공 지능에 대한 자신의 견해를 밝혔습니다. 그는 일반 인공 지능이 인간처럼 보고 듣고 생각하는 능력을 말하며, 듣는 데에는 시각 기술이 필요하다고 믿었습니다. 정보와 음성 정보가 뇌에 수집된 후 뇌는 이를 처리하고 판단하여 의사결정 아이디어를 제공하는 역할을 합니다. 오늘날의 방대한 데이터, 고급 알고리즘, 견고한 컴퓨팅 성능은 대형 모델의 대규모 개발도 촉진할 것입니다.
기본적인 관점을 설명한 후 He Zhongjiang은 China Telecom Star 의미 모델과 China Telecom Star 다중 모드 모델에 대해 자세히 설명했습니다. China Telecom Star Semantic Large Model은 일반 인공 지능의 핵심이며 더 나은 기능을 갖추고 있으며 여러 단계의 환각을 완화하여 "환각 비율"을 40% 줄일 수 있습니다. 앞으로 China Telecom의 스타 시맨틱 대형 모델은 외부적으로 2B2G 서비스를 강화하고, 품질과 효율성을 개선하며, 경험을 최적화할 수 있으며, 내부적으로 완전히 적용되고, 생산 협업 효율성을 향상시키며, 더 풍부한 애플리케이션을 보유할 수 있습니다. He Zhongjiang은 또한 China Telecom의 AI 팀이 오픈 소스 및 오픈 소스 프로세스에도 참여할 것이라고 밝혔습니다. 올해 말 이전에 수백억 모델을, 내년 4월에는 수천억 모델을 오픈 소스화할 예정입니다. 오픈소스로 공개됩니다.
He Zhongjiang은 China Telecom Star 다중 모달 대형 모델을 소개하면서 China Telecom이 GPU 효율성을 크게 향상시키고 추론 속도를 4.5배 높이기 위해 혼합 정밀도 전략을 사용하여 현재 12억 개가 넘는 이미지와 텍스트 쌍을 훈련했다고 말했습니다. 다중 모드 대형 모델은 차세대 디지털 세대의 기본 능력 기반으로 사용될 것입니다.
Wanhao 스마트 고객 서비스 음성을 Supernatural TTS1.0과 비교하면서 He Zhongjiang은 China Telecom의 Xingchen Voice Large Model 1.0이 실제 사람과 비슷한 자연스러움을 얻을 수 있으며 잘 구성된 음성으로의 실시간 스트리밍이 첫 번째 패킷 응답 시간이 더 짧다고 말했습니다. 50밀리초 이상, 매우 작은 데이터를 지원합니다. 정량적 사운드 변환 및 사용자 정의를 통해 더 좋고, 더 빠르고, 더 유연합니다. 그는 또한 Supernatural Speech Synthesis 2.0이 2024년 중반에 출시될 것이라고 밝혔습니다.
China Telecom HR은 China Telecom Star 다중 모드 대형 모델을 기반으로 하며 기본 디지털 아바타를 사용하여 메이크업 액세서리 임의 매칭, 개인화 생성 및 사용자 정의와 같은 기능을 표시합니다. He Zhongjiang은 대규모 모델 기술이 지속적으로 향상되고 지식이 지속적으로 풍부해짐에 따라 가상 공간의 디지털 사람과 현실 세계의 로봇이 사람들의 생산, 운영 및 생활과 정보화 시대에 점점 더 많은 영향을 미칠 것이라고 말했습니다. 인공지능이 진짜로 다가오고 있다!
Operator Finance(공식 WeChat 공개 계정 yyscjrd) - 기술, 금융, 증권, 자동차, 부동산, 식품, 의약품, 일용품, 와인 및 기타 소비재를 포괄적으로 다루는 주류 금융 웹사이트입니다.
위 내용은 China Telecom 인공 지능 총괄 관리자 He Zhongjiang: Supernatural Voice 2.0이 2024년에 출시될 예정입니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!