Sepuluh alat anotasi teks percuma sumber terbuka yang disyorkan
Kerja anotasi teks ialah kerja label atau teg yang sepadan dengan kandungan tertentu dalam teks. Tujuan utamanya adalah untuk memberikan maklumat tambahan kepada teks untuk analisis dan pemprosesan yang lebih mendalam, terutamanya dalam bidang kecerdasan buatan.
Anotasi teks adalah penting untuk tugas pembelajaran mesin yang diawasi dalam aplikasi kecerdasan buatan. Ia digunakan untuk melatih model AI untuk membantu memahami maklumat teks bahasa semula jadi dengan lebih tepat dan meningkatkan prestasi tugasan seperti klasifikasi teks, analisis sentimen dan terjemahan bahasa. Melalui anotasi teks, kami boleh mengajar model AI untuk mengenali entiti dalam teks, memahami konteks dan membuat ramalan yang tepat apabila data baharu yang serupa muncul.
Artikel ini terutamanya mengesyorkan beberapa alat anotasi teks sumber terbuka yang lebih baik.
1.Label Studio
https://github.com/HumanSignal/label-studio
Label Studio ialah alat anotasi data sumber terbuka yang boleh mengendalikan berbilang jenis data dan menyokong pengeksportan ke pelbagai format model . Ia digunakan secara meluas untuk menyediakan data mentah atau menambah baik data latihan sedia ada untuk meningkatkan ketepatan model pembelajaran mesin.
2.Doccano
https://github.com/doccano/doccano
Doccano ialah alat anotasi teks sumber terbuka yang menyediakan fungsi untuk pengelasan teks, pelabelan jujukan dan jujukan. Ia menyokong kerjasama pasukan anotasi teks, berbilang bahasa, apl mudah alih, emoji, tema gelap dan API gaya REST. Boleh dipasang menggunakan Docker dan Docker Compose.
3.Universal Data Tool
https://github.com/UniversalDataTool/universal-data-tool
Alat Data Universal ialah alat untuk mengedit dan menganotasi pelbagai jenis data, (termasuk teks, audio dan dokumen). Ia menyokong pelbagai jenis data dan menyediakan kerjasama masa nyata, GUI yang mudah digunakan, penciptaan kursus latihan untuk pencatat teks dan banyak lagi. Alat ini tersedia di web atau sebagai aplikasi desktop dan menyokong muat turun dan muat naik data dalam format CSV atau JSON.
4.YEDDA
https://github.com/jiesutd/YEDDA
YEDDA ialah alat anotasi teks, simbol emotik dan pelbagai bahasa yang boleh digunakan dalam pelbagai bahasa Ia menyokong penggunaan pintasan, memerintah model dan mengeksport teks anotasi sebagai teks urutan. Menyokong fungsi seperti pengesyoran pintar dan analisis pentadbir.
YEDDA serasi dengan semua sistem pengendalian utama, termasuk Windows, Linux dan MacOS.
5.Argilla
https://github.com/argilla-io/argilla
Argilla ialah platform kerjasama data sumber terbuka untuk jurutera kecerdasan buatan dan pakar domain, menyediakan output data yang berkualiti tinggi dan cekap.
Ia membantu mengawal kualiti data dan meningkatkan kualiti output AI, dan meningkatkan kecekapan dengan membolehkan lelaran data dan model yang pantas. Argilla juga menyediakan pengurusan data dan alat latihan model.
6.KernAI Refinery
https://github.com/code-kern-ai/refinery
Refinery ialah platform sumber terbuka daripada KernAI yang direka untuk saintis data bahasa semula jadi. Ia menyediakan fungsi seperti anotasi data separa automatik, penilaian kualiti subset data dan pemantauan data berpusat, bertujuan untuk meningkatkan kecekapan pelabelan manual.
Alat ini memanfaatkan teknologi seperti Hugging Face dan spaCy untuk membina model bahasa pra-bina dan disepadukan dengan alatan pelabelan lain untuk pemprosesan data yang fleksibel.
Ciri-ciri:
- Aliran kerja pelabelan automatik (Separuh) untuk tugas NLP
- Pengkelasan manual dan program serta pelabelan rentang
- Menyokong penyepaduan dengan perpustakaan dan rangka kerja terkini
- Buat dan urus jadual carian/pengetahuan asas -berasaskan persamaan Rekod dan perolehan terpencil
- Sesi penandaan boleh dihiris
- Berbilang tugas penandaan bagi setiap projek
- Perpustakaan automasi yang kaya
- Pengurusan dan pemantauan data yang meluas
- Disepadukan dengan Wajah Memeluk untuk penciptaan model berasaskan Data
- secara automatik untuk muat naik/muat turun data
- Ikhtisar metrik projek
- Akses dan lanjutkan data melalui Python SDK
- Pengubahsuaian harta di tapak
- Kerjasama pasukan dalam versi dihoskan
- Akses berasaskan peranan untuk berbilang pengguna dan teg yang diminimumkan aliran kerja penandaan kumpulan
- Mengira konsensus antara pencatat secara automatik
- 7.Recogito.js
https://github.com/recogito/recogito-js
adalah pustaka JavaScript.makanan, digunakan untuk menambah fungsi anotasi teks pada halaman web atau membina program anotasi teks tersuai. Ia boleh dipasang melalui npm atau memuat turun versi terkini.
8. Label Sleuth
https://github.com/label-sleuth/label-sleuth
Label Sleuth ialah sistem tanpa kod sumber terbuka untuk pelabelan dan pengelasan teks. Ia membolehkan pakar dalam bidang seperti doktor, peguam dan ahli psikologi membina model NLP tersuai tanpa kerjasama pakar NLP.
Biasanya penciptaan model NLP memerlukan kepakaran domain dan pembelajaran mesin. Label Sleuth memintas keperluan untuk kepakaran NLP dengan anotasi teks intuitif dan pembinaan model AI. Semasa pengguna melabelkan data, model pembelajaran mesin dilatih di latar belakang, membuat ramalan dan mencadangkan perkara yang perlu dilabelkan seterusnya.
9.Markup
https://github.com/samueldobbie/markup
Markup ialah alat anotasi dalam talian yang boleh digunakan untuk menukar dokumen tidak berstruktur kepada format NLP dan tugasan ML contohnya: pengiktirafan entiti. Pembelajaran serentak sambil anda membuat anotasi untuk meramal dan mengesyorkan anotasi yang lebih kompleks, dan juga menyediakan akses bersepadu kepada ontologi biasa dan tersuai untuk pemetaan konsep.
Ciri:
Anotasi ramalan: Fungsi anotasi ramalan terdorong pembelajaran mesin Markup boleh mengesyorkan anotasi yang lebih kompleks semasa anda bekerja, menjadikan proses anotasi lebih cekap.
Teg akses ontologi bersepadu: Menyediakan akses bersepadu kepada pelbagai ontologi biasa (cth. UMLS, SNOMED-CT, ICD-10), serta keupayaan untuk memuat naik ontologi tersuai untuk pemetaan konsep.
- Pemetaan ontologi ramalan: Ciri pemetaan ontologi ramalan Markup menggunakan pembelajaran mesin untuk mengesyorkan pemetaan yang sesuai kepada istilah standard dan tersuai berdasarkan teks yang anda anotasikan.
- Antara Muka Mesra Pengguna: Sama ada anda pakar teknikal atau pemula, antara muka mesra pengguna Markup memudahkan sesiapa sahaja untuk mula menganotasi dokumen dengan persediaan yang minimum. Kentang Tugasan. Boleh dijalankan sebagai pelayan web, didorong oleh satu fail konfigurasi, tidak memerlukan pengekodan permulaan. Tetapi Kentang mudah disesuaikan, dan biasanya tidak memerlukan reka bentuk web tambahan untuk melaraskan antara muka operasi untuk anotasi teks.
- Ciri Utama:
- Mudah untuk disediakan dan disesuaikan
Withs
kecekapan anotasi Lebih memahami keupayaan anotasi, seperti soalan pra dan selepas penapis Ciri kawalan kualiti, seperti ujian perhatian, ujian kelayakan dan semakan masa terbina dalam
Atas ialah kandungan terperinci Sepuluh alat anotasi teks percuma sumber terbuka yang disyorkan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Panduan Lengkap untuk Memeriksa Konfigurasi HDFS Dalam Sistem CentOS Artikel ini akan membimbing anda bagaimana untuk memeriksa konfigurasi dan menjalankan status HDFS secara berkesan pada sistem CentOS. Langkah -langkah berikut akan membantu anda memahami sepenuhnya persediaan dan operasi HDFS. Sahkan Pembolehubah Alam Sekitar Hadoop: Pertama, pastikan pembolehubah persekitaran Hadoop ditetapkan dengan betul. Di terminal, laksanakan arahan berikut untuk mengesahkan bahawa Hadoop dipasang dan dikonfigurasi dengan betul: Hadoopversion Semak fail konfigurasi HDFS: Fail konfigurasi teras HDFS terletak di/etc/hadoop/conf/direktori, di mana core-site.xml dan hdfs-site.xml adalah kritikal. gunakan

Perintah shutdown CentOS adalah penutupan, dan sintaks adalah tutup [pilihan] [maklumat]. Pilihan termasuk: -h menghentikan sistem dengan segera; -P mematikan kuasa selepas penutupan; -r mulakan semula; -T Waktu Menunggu. Masa boleh ditentukan sebagai segera (sekarang), minit (minit), atau masa tertentu (HH: mm). Maklumat tambahan boleh dipaparkan dalam mesej sistem.

Dasar sandaran dan pemulihan Gitlab di bawah sistem CentOS untuk memastikan keselamatan data dan pemulihan, Gitlab pada CentOS menyediakan pelbagai kaedah sandaran. Artikel ini akan memperkenalkan beberapa kaedah sandaran biasa, parameter konfigurasi dan proses pemulihan secara terperinci untuk membantu anda menubuhkan strategi sandaran dan pemulihan GitLab lengkap. 1. Backup Manual Gunakan Gitlab-Rakegitlab: Backup: Buat Perintah untuk Melaksanakan Backup Manual. Perintah ini menyokong maklumat utama seperti repositori Gitlab, pangkalan data, pengguna, kumpulan pengguna, kunci, dan kebenaran. Fail sandaran lalai disimpan dalam direktori/var/opt/gitlab/sandaran. Anda boleh mengubah suai /etc /gitlab

Memasang MySQL pada CentOS melibatkan langkah -langkah berikut: Menambah sumber MySQL YUM yang sesuai. Jalankan YUM Pasang Perintah MySQL-Server untuk memasang pelayan MySQL. Gunakan perintah mysql_secure_installation untuk membuat tetapan keselamatan, seperti menetapkan kata laluan pengguna root. Sesuaikan fail konfigurasi MySQL seperti yang diperlukan. Tune parameter MySQL dan mengoptimumkan pangkalan data untuk prestasi.

Panduan Lengkap untuk Melihat Log Gitlab Di bawah Sistem CentOS Artikel ini akan membimbing anda bagaimana untuk melihat pelbagai log Gitlab dalam sistem CentOS, termasuk log utama, log pengecualian, dan log lain yang berkaitan. Sila ambil perhatian bahawa laluan fail log mungkin berbeza -beza bergantung pada versi GitLab dan kaedah pemasangan. Jika laluan berikut tidak wujud, sila semak fail Direktori Pemasangan dan Konfigurasi GitLab. 1. Lihat log Gitlab utama Gunakan arahan berikut untuk melihat fail log utama aplikasi GitLabRails: Perintah: Sudocat/var/Log/Gitlab/Gitlab-Rails/Production.log Perintah ini akan memaparkan produk

Latihan yang diedarkan Pytorch pada sistem CentOS memerlukan langkah -langkah berikut: Pemasangan Pytorch: Premisnya ialah Python dan PIP dipasang dalam sistem CentOS. Bergantung pada versi CUDA anda, dapatkan arahan pemasangan yang sesuai dari laman web rasmi Pytorch. Untuk latihan CPU sahaja, anda boleh menggunakan arahan berikut: PipinstallToRchTorchVisionTorchaudio Jika anda memerlukan sokongan GPU, pastikan versi CUDA dan CUDNN yang sama dipasang dan gunakan versi pytorch yang sepadan untuk pemasangan. Konfigurasi Alam Sekitar Teragih: Latihan yang diedarkan biasanya memerlukan pelbagai mesin atau mesin berbilang mesin tunggal. Tempat

Membolehkan pecutan GPU pytorch pada sistem CentOS memerlukan pemasangan cuda, cudnn dan GPU versi pytorch. Langkah-langkah berikut akan membimbing anda melalui proses: Pemasangan CUDA dan CUDNN Tentukan keserasian versi CUDA: Gunakan perintah NVIDIA-SMI untuk melihat versi CUDA yang disokong oleh kad grafik NVIDIA anda. Sebagai contoh, kad grafik MX450 anda boleh menyokong CUDA11.1 atau lebih tinggi. Muat turun dan pasang Cudatoolkit: Lawati laman web rasmi Nvidiacudatoolkit dan muat turun dan pasang versi yang sepadan mengikut versi CUDA tertinggi yang disokong oleh kad grafik anda. Pasang Perpustakaan Cudnn:

Docker menggunakan ciri -ciri kernel Linux untuk menyediakan persekitaran berjalan yang cekap dan terpencil. Prinsip kerjanya adalah seperti berikut: 1. Cermin digunakan sebagai templat baca sahaja, yang mengandungi semua yang anda perlukan untuk menjalankan aplikasi; 2. Sistem Fail Kesatuan (Unionfs) menyusun pelbagai sistem fail, hanya menyimpan perbezaan, menjimatkan ruang dan mempercepatkan; 3. Daemon menguruskan cermin dan bekas, dan pelanggan menggunakannya untuk interaksi; 4. Ruang nama dan cgroups melaksanakan pengasingan kontena dan batasan sumber; 5. Pelbagai mod rangkaian menyokong interkoneksi kontena. Hanya dengan memahami konsep -konsep teras ini, anda boleh menggunakan Docker dengan lebih baik.
