


[Asal] Gunakan model besar untuk mencatat nota secara automatik, mengekstrak PPT dan mengatur wawancara produk AI baharu Alibaba Cloud 'Tongyi Listening' dibuka untuk ujian awam
Baca wartawan Chuang/Shenzhen Business Daily Chen Shu
Pada 1 Jun, Alibaba Cloud mengumumkan kemajuan model berskala besar Tongyi Produk AI baharu "Tongyi Listening" yang memfokus pada kandungan audio dan video telah dilancarkan secara rasmi, menjadi produk aplikasi model berskala besar yang pertama di China terbuka. kepada ujian awam.
Tongyi Tingwu disambungkan kepada keupayaan pemahaman dan ringkasan model besar Tongyi Qianwen, dan boleh menjadi pembantu AI yang berkuasa untuk pengguna dalam kerja dan belajar, membantu menyelesaikan transkripsi, mendapatkan semula, meringkas dan meringkaskan kandungan audio dan video dengan cekap pada bila-bila masa dan di mana-mana sahaja, seperti menggunakan model besar untuk mengambil nota secara automatik, menganjurkan temu duga, mengekstrak PPT, dsb. Semasa tempoh beta awam, pengguna boleh menerima masa transkripsi percuma selama lebih daripada 100 jam pemahaman mendengar.
"Dengan cara yang berbeza, audio dan video boleh dibaca dengan mudah, disusun dan dikongsi." CTO Awan Alibaba Zhou Jingren memperkenalkan bahawa Tingwu ialah pembantu AI kajian kerja yang menyasarkan senario kandungan audio dan video dengan nilai tambah pengetahuan yang tinggi . , seperti mesyuarat, kelas, temu bual, latihan, temu bual, siaran langsung, menonton video, mendengar podcast, dsb., boleh memperhalusi dan mempercepatkan pengetahuan dengan cepat melalui teknologi AI terkini seperti model besar.
[caption id="attachment_3846381" align="alignnone" width="1000"]
Mendengar Tongyi boleh menjana abstrak teks penuh, ringkasan bab dan ringkasan pertuturan secara automatik untuk audio dan video[/caption]
Tingwu menunjukkan demonstrasi langsung, yang merangkumi lebih daripada sepuluh fungsi kecerdasan buatan, yang boleh meningkatkan kecekapan pemindahan pengetahuan secara menyeluruh daripada audio dan video kepada grafik dan teks. Selain "pendengaran yang baik", ia boleh menjana rekod mesyuarat dengan ketepatan yang tinggi dan membezakan pembesar suara yang berbeza ini juga "sangat perseptif". teks penuh setiap penceramah Sudut pandangan, organisasi fokus dan perkara yang perlu dilakukan. Model besar akan dilancarkan dalam masa terdekat, termasuk fungsi seperti pengekstrakan satu klik PPT, AI menyoal pelbagai kandungan audio dan video, dan meringkaskan perenggan tertentu.
[caption id="attachment_3846394" align="alignnone" width="736"]
Pemalam Tongyi Tingwu Chrome akan tersedia untuk dimuat turun kepada semua pengguna dalam masa terdekat[/caption]
Untuk beberapa senario khusus, Listening juga telah menyediakan banyak "fungsi harta karun": buka pemalam Chrome, pelajar bahasa asing dan orang bermasalah pendengaran boleh menggunakan bar sari kata terapung dwibahasa untuk menonton video tanpa sari kata pada bila-bila masa dan Apabila jadual bercanggah, dengarkan Wu juga boleh menjadi "meeting stand-in" untuk profesional AI boleh merakam mesyuarat dan menyusun perkara penting apabila memasuki mesyuarat secara bisu untuk memudahkan pasca produksi video untuk pengamal media baharu Kajian semula Soal Jawab yang dianjurkan oleh Wu Ia membolehkan wartawan, penganalisis, peguam, HR dan kumpulan lain mengatur temu bual dengan lebih cekap.
Tingwu disambungkan dengan Cakera Awan Alibaba, dan kandungan audio dan video pada cakera awan boleh ditranskripsi dengan satu klik Pengguna Tingwu yang mendaftar semasa tempoh beta awam juga akan menerima ruang storan Cakera Awan Alibaba yang lebih besar, dan boleh berada dalam talian dalam cakera awan juga boleh dihasilkan secara automatik apabila memainkan video.
Zhou Jingren memperkenalkan bahawa Tingwu mengintegrasikan teknologi suara dan bahasa Alibaba yang paling canggih. Ia mempunyai model pengecaman pertuturan kelas industri generasi baharu Alibaba terbina dalam, dan ketepatan pengecaman menduduki tempat pertama dalam berbilang set data Cina yang berwibawa ia menyepadukan algoritma pembesar suara semantik pertuturan yang dibangunkan sendiri, dan boleh membezakan peranan dalam adegan di mana lebih banyak; daripada 10 orang bercakap; Selepas mengakses model besar Tongyi Qianwen, ia boleh meringkaskan puluhan ribu perkataan kandungan audio dan video, memimpin negara dalam ketepatan fakta dan kesempurnaan perkara utama, dan menyokong pemahaman soalan dan jawapan yang tepat merentas pelbagai audio dan kandungan video.
Pengulas: Tan Lugang
Atas ialah kandungan terperinci [Asal] Gunakan model besar untuk mencatat nota secara automatik, mengekstrak PPT dan mengatur wawancara produk AI baharu Alibaba Cloud 'Tongyi Listening' dibuka untuk ujian awam. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Pengekodan Vibe membentuk semula dunia pembangunan perisian dengan membiarkan kami membuat aplikasi menggunakan bahasa semulajadi dan bukannya kod yang tidak berkesudahan. Diilhamkan oleh penglihatan seperti Andrej Karpathy, pendekatan inovatif ini membolehkan Dev

Dall-E 3: Alat Penciptaan Imej AI Generatif AI Generatif merevolusi penciptaan kandungan, dan Dall-E 3, model penjanaan imej terbaru OpenAI, berada di barisan hadapan. Dikeluarkan pada bulan Oktober 2023, ia dibina pada pendahulunya, Dall-E dan Dall-E 2

Februari 2025 telah menjadi satu lagi bulan yang berubah-ubah untuk AI generatif, membawa kita beberapa peningkatan model yang paling dinanti-nantikan dan ciri-ciri baru yang hebat. Dari Xai's Grok 3 dan Anthropic's Claude 3.7 Sonnet, ke Openai's G

Yolo (anda hanya melihat sekali) telah menjadi kerangka pengesanan objek masa nyata yang terkemuka, dengan setiap lelaran bertambah baik pada versi sebelumnya. Versi terbaru Yolo V12 memperkenalkan kemajuan yang meningkatkan ketepatan

Projek AI Stargate $ 500 bilion, yang disokong oleh gergasi teknologi seperti Openai, Softbank, Oracle, dan Nvidia, dan disokong oleh kerajaan A.S., bertujuan untuk mengukuhkan kepimpinan AI Amerika. Usaha bercita -cita tinggi ini menjanjikan masa depan yang dibentuk oleh AI Advanceme

Google's Veo 2 dan Openai's Sora: Generator Video AI Mana yang memerintah Supreme? Kedua -dua platform menghasilkan video AI yang mengagumkan, tetapi kekuatan mereka terletak di kawasan yang berbeza. Perbandingan ini, menggunakan pelbagai arahan, mendedahkan alat yang paling sesuai dengan keperluan anda. T

Google Deepmind's Gencast: AI Revolusioner untuk Peramalan Cuaca Peramalan cuaca telah menjalani transformasi dramatik, bergerak dari pemerhatian asas kepada ramalan berkuasa AI yang canggih. Google Deepmind's Gencast, tanah air

Artikel ini membincangkan model AI yang melampaui chatgpt, seperti Lamda, Llama, dan Grok, menonjolkan kelebihan mereka dalam ketepatan, pemahaman, dan kesan industri. (159 aksara)
