Pada tahun 2024, Persidangan Imej dan Grafik China akan dibuka dengan megah di ibu kota purba Xi'an. Persidangan ini telah dihoskan oleh Persatuan Imej dan Grafik Cina dan dihoskan oleh Universiti Perubatan Tentera Udara, Universiti Xi'an Jiaotong, dan Universiti Politeknik Barat Laut Melalui lebih daripada 20 forum dan lebih daripada 100 pencapaian, ia memfokuskan pada memaparkan kecerdasan buatan pengeluaran. model besar, dan pembelajaran mesin , pengkomputeran yang diilhamkan oleh otak dan bidang grafik imej yang lain.
Teknologi model besar sedang digunakan secara meluas dengan inovasi teknologi untuk memenuhi keperluan pemprosesan imej banyak industri. Semasa persidangan itu, Jawatankuasa Khas Analisis dan Pengiktirafan Imej Dokumen CSIG dan Shanghai Hehe Information Technology Co., Ltd. (dirujuk sebagai "Hehe Xinheng") bersama-sama menganjurkan forum "Large Model Technology and Its Frontier Applications", dengan wakil dari Selatan Universiti Teknologi China dan wakil Pakar dari Universiti Shanghai Jiao Tong, Universiti Tsinghua, Universiti Fudan, Makmal Kepintaran Buatan Shanghai, Universiti Hehexin dan universiti lain, institusi penyelidikan dan perusahaan menjalankan perbincangan mendalam tentang pembangunan dan aplikasi teknologi model besar dalam medan imej.
Kapsyen: Pengikut industri mendengar perkongsian forum "Large Model Technology and Its Frontier Applications"
Di sebalik "lonjakan" model besar, terdapat model "Teknologi Model Besar dan Aplikasi Sempadannya" krisis tersembunyi korpus". Epoch Research, sekumpulan penyelidik kecerdasan buatan, menganggarkan bahawa set data pembelajaran mesin boleh kehabisan "data bahasa berkualiti tinggi" menjelang 2026. Pada peringkat ini, sejumlah besar data korpus berkualiti tinggi wujud dalam buku, kertas kerja, laporan penyelidikan, dokumen korporat dan dokumen lain susun atur korpus latihan menyekat. model besar Keupayaan aplikasi untuk pemprosesan dan soal jawab dokumen model besar. Kemajuan penghuraian dokumenteknologi membolehkan mesin mengenal pasti pelbagai elemen dalam dokumen, memproses teks yang lebih baik, jadual, imej, dsb. pelbagai jenis data, membaca semula data, Mempercepatkan latihan dan aplikasi model besar. Di forum tersebut, Chang Yang, Pengarah R&D Bahagian Inovasi Pintar Maklumat Hehe, berkongsi hasil kerja teknologi pemprosesan dokumen pintar Hehe Information dalam bidang penghuraian dokumen, membawa perspektif teknikal baharu kepada para peserta.
🎜"Kesukaran menghurai dokumen ialah bagaimana untuk mengenal pasti pelbagai elemen dalam dokumen dengan tepat dan memahami hubungan logik antara mereka. Anda perlu memberi perhatian kepada 'analisis reka letak fizikal' dan ' Analisis reka letak logik" Menurut Chang Yang, analisis susun atur fizikal memfokuskan pada ciri visual dan susun atur dokumen. Tugas utama adalah untuk mengagregatkan teks yang sangat relevan ke dalam satu kawasan, seperti perenggan, jadual, dsb. Tugas pengesanan sasaran dipilih untuk pemodelan, dan model pengesanan satu peringkat berdasarkan regresi digunakan untuk pemasangan, untuk mendapatkan pelbagai kaedah susun atur dalam dokumen, analisis susun atur logik memberi tumpuan kepada analisis semantik ciri, dan tugas utama adalah untuk menggabungkan blok Teks yang berbeza dimodelkan mengikut semantik, contohnya, melalui hubungan hierarki semantik, membentuk struktur pohon direktori.
Dalam teknologi penghuraian dokumen, tugas seperti pengesanan elemen dokumen, pengecaman jadual teks, dokumen susun atur analisis, dan pemulihan susunan bacaan melibatkan pertimbangan elemen susun atur dan bidang pemprosesan dokumen. Melalui lebih sepuluh tahun pengumpulan teknikal, Hehe Maklumat telah membuka analisis fail elektronik, fail yang diimbasimejmemproses, pengiktirafan teks, pengecaman jadual, analisis susun atur, analisis susun atur dan Typesetting susun atur dan proses pemprosesan pintar dokumen lain, dalam menghadapi dokumen elektronik dan imbasan, boleh mengenal pasti secara fleksibel teks, jadual, , meja tanpa wayar, pengepala muka surat formula, imej, carta alir dan elemen susun atur lain, dengan tepat memulihkan susunan bacaan dokumen, dan menyediakan korpus latihan yang tepat dan dokumenaplikasi soal jawab pengalaman untuk model besar .
Kapsyen: Penyelidik dan pelajar universiti berbaris untuk mengalami teknologi pemprosesan dokumen pintar
"Semasa penyelidikan kami, kami mendapati bahawa dokumen dunia sebenar mempunyai jenis susun atur yang sangat kaya, dan mustahil untuk menggunakan lajur tunggal. "Lajur berganda, tiga lajur dan kategori lain untuk ditakrifkan bahawa dalam beberapa tahun kebelakangan ini, perkembangan canggih seperti pengesanan objek perbendaharaan kata terbuka (OVD), penjajaran semantik visual (Penjajaran), dan model generatif akan membawa aspek-aspek baru kepada analisis reka letak Berdasarkan idea penyelidikan, Pasukan Teknologi Maklumat Hehe juga akan terus mendalami bidang pemprosesan dokumen pintar, supaya teknologi baharu dapat menjana nilai dalam industri dengan lebih cepat.
Atas ialah kandungan terperinci Di CCIG2024, Hehe Teknologi analisis dokumen maklumat menyelesaikan masalah 'kebuluran' korpus model besar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!