


[원본] 대형 모델을 사용해 자동으로 메모 작성, PPT 추출, 인터뷰 정리 알리바바 클라우드의 새로운 AI 제품 'Tongyi Listening'이 공개 테스트 중입니다.
추앙/선전 비즈니스 일간지 첸 슈 기자 읽기
6월 1일, Alibaba Cloud는 Tongyi 대형 모델의 진행 상황을 발표했습니다. 오디오 및 비디오 콘텐츠에 초점을 맞춘 새로운 AI 제품인 "Tongyi Listening"이 공식 출시되어 공개 테스트에 공개된 중국 최초의 대형 모델 애플리케이션 제품이 되었습니다.
Tongyi Tingwu는 Tongyi Qianwen 대형 모델의 이해 및 요약 기능과 연결되어 업무 및 학습 중인 사용자를 위한 강력한 AI 보조자가 되어 언제든지 오디오 및 비디오 콘텐츠의 복사, 검색, 요약 및 구성을 효율적으로 완료하도록 돕습니다. 예를 들어 대형 모델을 사용하여 자동으로 메모 작성, 인터뷰 구성, PPT 추출 등을 수행할 수 있습니다. 공개 베타 기간 동안 사용자는 100시간 이상의 듣기 이해를 위한 무료 녹취 시간을 받을 수 있습니다.
"다른 방식으로 오디오와 비디오를 쉽게 읽고 정리하고 공유할 수 있습니다." Alibaba Cloud CTO Zhou Jingren은 Tingwu가 지식의 부가가치가 높은 오디오 및 비디오 콘텐츠 시나리오를 대상으로 하는 업무 학습 AI 도우미라고 소개했습니다. 미팅, 수업, 인터뷰, 트레이닝, 인터뷰, 라이브 방송, 영상 시청, 팟캐스트 청취 등 대형 모델 등 최신 AI 기술을 통해 빠르게 지식을 다듬고 축적할 수 있습니다.
[caption id="attachment_3846381" align="alignnone" width="1000"]
Tongyi Listening은 오디오 및 비디오에 대한 전체 텍스트 초록, 장 요약, 음성 요약을 자동으로 생성할 수 있습니다[/caption]
Tingwu는 오디오 및 비디오에서 그래픽 및 텍스트로의 지식 전달 효율성을 종합적으로 향상시킬 수 있는 10개 이상의 인공 지능 기능이 포함된 라이브 시연을 선보였습니다. "좋은 청각" 외에도 높은 정확도로 회의 기록을 생성하고 다양한 화자를 구별할 수 있습니다. 이 AI 보조자는 또한 "매우 지각적"입니다. 각 연사의 전문, 관점, 초점 구성 및 할 일 목록. 원클릭으로 PPT를 추출하고, 여러 오디오 및 비디오 콘텐츠에 대해 AI 질문을 하고, 특정 문단을 요약하는 등의 기능을 포함한 대형 모델도 조만간 출시될 예정이다.
[caption id="attachment_3846394" align="alignnone" width="736"]
Tongyi Tingwu Chrome 플러그인은 가까운 시일 내에 모든 사용자가 다운로드할 수 있게 될 예정입니다[/caption]
일부 틈새 시나리오의 경우 Tingwu는 많은 "보물 기능"도 설정했습니다. Chrome 플러그인을 열면 외국어 학습자와 청각 장애가 있는 사람이 이중 언어 플로팅 자막을 사용하여 언제 어디서나 자막 없이 동영상을 시청할 수 있습니다. Tingwu는 여전히 전문가를 위한 "회의 대리인"이 될 수 있습니다. 음소거 상황에서 회의에 참여할 때 AI는 회의를 녹음하고 사용자를 대신하여 핵심 사항을 정리할 수 있습니다. 뉴미디어 실무자의 비디오 후반 작업을 용이하게 하는 자막 파일로 청취 이해에 대한 Q&A 검토를 통해 기자, 분석가, 변호사, HR 및 기타 그룹이 인터뷰를 보다 효율적으로 구성할 수 있습니다.
Tingwu는 Alibaba Cloud Disk와 연결되어 있으며 클라우드 디스크의 오디오 및 비디오 콘텐츠를 한 번의 클릭으로 전사할 수 있습니다. 공개 베타 기간에 등록한 Tingwu 사용자는 더 큰 Alibaba Cloud Disk 저장 공간을 받고 클라우드에서 온라인으로 비디오를 재생할 수 있습니다. 디스크 재생 시 자막이 자동으로 생성될 수도 있습니다.
Zhou Jingren은 Tingwu가 Alibaba의 가장 진보된 음성 및 언어 기술을 통합한다고 소개했습니다. Alibaba의 차세대 산업용 음성 인식 모델이 내장되어 있으며, 자체 개발한 음성 의미론 다중 모드 스피커 알고리즘을 통합하여 인식 정확도가 여러 권위 있는 중국 데이터 세트에서 1위를 차지하고 있습니다. 10명 이상의 사람이 말하고 있습니다. Tongyi Qianwen 대형 모델에 액세스한 후 수만 단어의 오디오 및 비디오 콘텐츠를 요약할 수 있어 사실적 정확성과 핵심 사항의 완전성 측면에서 국가를 선도하고 전체에 대한 정확한 질문 및 답변 이해를 지원합니다. 다양한 오디오 및 비디오 콘텐츠.
검토자: Tan Lugang
위 내용은 [원본] 대형 모델을 사용해 자동으로 메모 작성, PPT 추출, 인터뷰 정리 알리바바 클라우드의 새로운 AI 제품 'Tongyi Listening'이 공개 테스트 중입니다.의 상세 내용입니다. 자세한 내용은 PHP 중국어 웹사이트의 기타 관련 기사를 참조하세요!

핫 AI 도구

Undresser.AI Undress
사실적인 누드 사진을 만들기 위한 AI 기반 앱

AI Clothes Remover
사진에서 옷을 제거하는 온라인 AI 도구입니다.

Undress AI Tool
무료로 이미지를 벗다

Clothoff.io
AI 옷 제거제

AI Hentai Generator
AI Hentai를 무료로 생성하십시오.

인기 기사

뜨거운 도구

메모장++7.3.1
사용하기 쉬운 무료 코드 편집기

SublimeText3 중국어 버전
중국어 버전, 사용하기 매우 쉽습니다.

스튜디오 13.0.1 보내기
강력한 PHP 통합 개발 환경

드림위버 CS6
시각적 웹 개발 도구

SublimeText3 Mac 버전
신 수준의 코드 편집 소프트웨어(SublimeText3)

뜨거운 주제











Vibe Coding은 끝없는 코드 라인 대신 자연 언어를 사용하여 애플리케이션을 생성함으로써 소프트웨어 개발의 세계를 재구성하고 있습니다. Andrej Karpathy와 같은 비전가들로부터 영감을 얻은이 혁신적인 접근 방식은 Dev가

2025 년 2 월은 Generative AI의 또 다른 게임 변화 달이었으며, 가장 기대되는 모델 업그레이드와 획기적인 새로운 기능을 제공합니다. Xai 's Grok 3 및 Anthropic's Claude 3.7 Sonnet, Openai 's G에 이르기까지

Yolo (한 번만 보이면)는 주요 실시간 객체 감지 프레임 워크였으며 각 반복은 이전 버전에서 개선되었습니다. 최신 버전 Yolo V12는 정확도를 크게 향상시키는 발전을 소개합니다.

이 기사는 최고의 AI 아트 생성기를 검토하여 자신의 기능, 창의적인 프로젝트에 대한 적합성 및 가치에 대해 논의합니다. Midjourney를 전문가에게 최고의 가치로 강조하고 고품질의 사용자 정의 가능한 예술에 Dall-E 2를 추천합니다.

ChatGpt 4는 현재 이용 가능하고 널리 사용되며 ChatGpt 3.5와 같은 전임자와 비교하여 상황을 이해하고 일관된 응답을 생성하는 데 상당한 개선을 보여줍니다. 향후 개발에는보다 개인화 된 인터가 포함될 수 있습니다

이 기사에서는 AI 모델이 Lamda, Llama 및 Grok과 같은 Chatgpt를 능가하는 것에 대해 논의하여 정확성, 이해 및 산업 영향의 장점을 강조합니다. (159 자).

Mistral OCR : 복수 문서 이해를 가진 검색 방지 생성 혁신 RAG (Resprieved-Augmented Generation) 시스템은 AI 기능을 크게 발전시켜보다 정보에 입각 한 대응을 위해 방대한 데이터 저장에 액세스 할 수 있도록했습니다.

이 기사는 Grammarly, Jasper, Copy.ai, Writesonic 및 Rytr와 같은 최고의 AI 작문 조수에 대해 논의하여 콘텐츠 제작을위한 독특한 기능에 중점을 둡니다. Jasper는 SEO 최적화가 뛰어나고 AI 도구는 톤 구성을 유지하는 데 도움이된다고 주장합니다.
