Di ICDAR 2023, acara teratas dalam bidang pengecaman teks global (OCR), pasukan OCR Tencent memenangi empat kejuaraan berdasarkan algoritma yang dibangunkan sendiri Ini adalah kali keempat berturut-turut menyertai persidangan itu dan mencapai keputusan yang baik sejak 2017, 2019, dan 2021. Sebanyak 18 kejohanan pensijilan rasmi telah dimenangi, menunjukkan tahap teknologi OCR Tencent bertaraf dunia.
Persidangan ICDAR ialah persidangan akademik berwibawa yang diiktiraf dalam bidang analisis dan pengiktirafan imej dokumen global Ia diadakan setiap dua tahun Acara ini telah menarik hampir 8,000 pasukan dari lebih 100 negara untuk menyertai. Pertandingan ICDAR terkenal di dalam dan luar negara kerana kesukaran teknikalnya yang sangat tinggi dan kepraktisan yang kukuh Tidak seperti kedudukan tidak formal selepas permainan, pertandingan rasmi yang disahkan secara rasmi oleh ICDAR menggunakan set data baharu, dan maklumat serta maklumat pasukan yang mengambil bahagian. tidak diumumkan semasa pertandingan, sambil mengehadkan masa dan bilangan penyerahan keputusan, adalah "menaip buta" yang sangat sukar.
Tahun ini, pasukan Tencent OCR dianggotai bersama oleh Jabatan Platform Data Tencent dan Jabatan Seni Bina Teknologi WeChat Ia memberi tumpuan untuk menyertai dua pertandingan utama DSText (Pengiktirafan Teks Video Teks Kecil) dan SVRD (Pengestrakan Maklumat Berstruktur). dan mencapai kejuaraan trek 4 A.
Pertandingan DSText (Pengecaman Teks Video Teks Kecil Padat) menyediakan dua tugas: penjejakan teks video dan pengecaman hujung-ke-hujung teks video. Oleh kerana teksnya sangat padat dan sangat kecil, ditambah pula dengan gangguan persekitaran (goncangan kamera, kabur gerakan, perubahan pencahayaan, dll.) dan pasca penyuntingan (pemotongan skrin berbilang kanta, latar belakang tiruan, penukaran antara muka permainan, dll.), ia adalah sukar untuk dikesan dan dijejak dengan tepat daripada bingkai video , Mengecam teks memerlukan keteguhan tinggi algoritma dan amat mencabar. Beberapa bingkai video pertandingan ditunjukkan di bawah:
Bingkai skema pertandingan ICDAR-DSText
Dalam kesemua 2 tugasan pertandingan DSText, pasukan Tencent OCR memenangi kejuaraan dengan pendahuluan mutlak.
Antaranya, Tugasan 1 menyasarkan untuk menjejaki semua strim teks dalam video dan mengagregatkan bingkai pengesanan yang dimiliki oleh contoh teks yang sama antara bingkai video Penunjuk penilaian ialah Tencent mendahului tempat kedua dengan 12.04%.
Penjejakan Teks Video: Sijil Kejohanan
mendahului tempat kedua sebanyak 11.93%.
Teks video pengiktirafan hujung ke hujung: Sijil kejohanan
SVRD (Pengekstrakan Maklumat Berstruktur) pertandingan termasuk dua trek utama, HUST-CELL dan BAIDU-FEST 4 tugasan: Pengekstrakan perhubungan entiti dokumen kompleks (Pemautan Entiti Kompleks E2E), pengekstrakan semantik entiti dokumen kompleks (Pelabelan Entiti Kompleks E2E), pengekstrakan maklumat berstruktur sifar (E2E Pengekstrakan Teks Berstruktur Sifar) dan pengekstrakan maklumat berstruktur sampel kecil ( Pengekstrakan Teks Berstruktur Sedikit Tangkapan). Oleh kerana susun atur yang kompleks dan struktur imej dokumen yang pelbagai, koleksi imej pemandangan semula jadi yang tidak teratur, latar belakang yang kompleks, pecah, lentur, ubah bentuk dan masalah lain, persaingan agak mencabar. Beberapa gambar pertandingan ditunjukkan di bawah:
Atas ialah kandungan terperinci Pasukan Tencent OCR memenangi empat kejuaraan dalam pertandingan ICDAR. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!