


Kumpulan Ant dan Universiti Zhejiang bersama-sama mengeluarkan OneKE, rangka kerja pengekstrakan pengetahuan model besar sumber terbuka
Baru-baru ini, OneKE, rangka kerja pengekstrakan pengetahuan model besar yang dibangunkan bersama oleh Ant Group dan Universiti Zhejiang, diumumkan sebagai sumber terbuka dan didermakan kepada komuniti graf pengetahuan terbuka OpenKG.
Graf pengetahuan ialah salah satu teknologi utama untuk mencapai kebolehpercayaan dan kebolehkawalan model besar dapat membantu membina graf pengetahuan domain. OneKE komited untuk membantu penyelidik dan pembangun menangani isu seperti pengekstrakan maklumat, penstrukturan data teks dan pembinaan graf pengetahuan dengan lebih baik.
Mengekstrak peristiwa berisiko, entiti orang, entiti institusi, dll. melalui OneKE boleh membentangkan konteks acara, arah aliran pembangunan peristiwa dan hubungan antara entiti dengan jelas dengan jelas. Graf yang dibina boleh membantu model besar merealisasikan penaakulan yang kompleks merentas entiti dan dokumen. OneKE adalah dwibahasa dalam bahasa Cina dan Inggeris, menyokong rangka kerja sumber terbuka OpenSPG dan DeepKE, dan boleh digunakan di luar kotak.
Model bahasa yang besar telah meningkatkan dengan ketara keupayaan sistem kecerdasan buatan untuk memproses pengetahuan dunia. Walau bagaimanapun, maklumat dunia sebenar sangat berpecah-belah dan tidak tersusun, jadi apabila model bahasa besar mengendalikan tugas pengekstrakan maklumat, mereka masih akan mendapat hasil yang buruk disebabkan perbezaan besar antara kandungan yang diekstrak dan ungkapan bahasa semula jadi di samping itu, maklumat teks bahasa semula jadi Di sana terdapat banyak kekaburan, polisemi, metafora, dsb., yang membawa cabaran yang lebih besar kepada tugas pengekstrakan pengetahuan. Ini juga membawa kepada fakta bahawa kecerdasan buatan generatif yang diwakili oleh model bahasa yang besar masih mempunyai masalah seperti keupayaan penaakulan yang tidak mencukupi, kekurangan pengetahuan fakta, dan hasil penjanaan yang tidak stabil, yang sangat menghalang perindustrian model bahasa besar.
Rangka kerja pengekstrakan pengetahuan bersatu boleh mengurangkan kos membina graf pengetahuan domain dengan ketara dan mempunyai pelbagai senario aplikasi. Ini bermakna dengan mengekstrak pengetahuan berstruktur daripada data besar-besaran, membina graf pengetahuan berkualiti tinggi dan mewujudkan hubungan logik antara elemen pengetahuan, keputusan penaakulan yang boleh dijelaskan boleh dicapai, dan ia juga boleh digunakan untuk meningkatkan model besar untuk mengurangkan ilusi dan meningkatkan kestabilan. mempercepatkan aplikasi model besar dalam bidang menegak.
Dalam bidang perubatan, pengurusan pengetahuan tentang pengalaman doktor dicapai melalui pengekstrakan pengetahuan, dan diagnosis dan rawatan tambahan yang boleh dikawal serta Soal Jawab perubatan dibina. Dalam bidang kewangan, jabatan pengekstrakan pengetahuan digunakan untuk penunjuk kewangan, peristiwa risiko, hubungan sebab akibat, rantaian industri, dsb. untuk mencapai penjanaan laporan penyelidikan kewangan automatik, ramalan risiko, analisis rantaian industri, dsb. Dalam senario hal ehwal kerajaan, pengetahuan tentang peraturan hal ehwal kerajaan dapat direalisasikan, meningkatkan kecekapan dan membuat keputusan yang tepat bagi perkhidmatan hal ehwal kerajaan.
Untuk mempercepatkan pelaksanaan industri kecerdasan buatan berasaskan pengeluaran, Ant Group dan Zhejiang University telah menubuhkan makmal graf pengetahuan bersama untuk memberi tumpuan kepada topik seperti pembinaan graf pengetahuan yang dipertingkatkan oleh model besar, fungsi penjanaan yang dipercayai dan boleh dikawal yang dipertingkatkan oleh pengetahuan , dan peta dunia pengetahuan domain Menjalankan kerjasama menyeluruh dengan tujuan untuk mewujudkan paradigma fungsi generasi terkawal dengan peningkatan dua hala model bahasa besar dan graf pengetahuan melalui penyelidikan teknikal bersama.
Ant Group dan Universiti Zhejiang bersama-sama menubuhkan dan meningkatkan keupayaan model besar Ant Bailing dalam bidang pengekstrakan pengetahuan, dan mengeluarkan OneKE, rangka kerja pengekstrakan pengetahuan model besar dwibahasa Cina-Inggeris, dan versi sumber terbuka berdasarkan LLaMA2 penuh -penalaan halus parameter. Penunjuk ujian menunjukkan bahawa OneKE telah mencapai keputusan yang agak baik pada berbilang tugas pengekstrakan entiti/perhubungan/peristiwa yang diselia sepenuhnya dan sampel sifar.
OneKE ialah alat pengekstrakan pengetahuan dwibahasa Cina-Inggeris yang sangat baik Ia telah mencapai keputusan yang agak baik dalam tugas pengecaman entiti bernama NER Cina, tugas pengekstrakan hubungan RE dan tugas pengekstrakan acara EE.
Liang Lei, ketua graf pengetahuan di Ant Group, berkata Ant akan terus mengoptimumkan prestasi pengekstrakan pengetahuan untuk memenuhi keperluan model besar yang boleh dikawal dan boleh dipercayai dalam senario yang berbeza. Pada masa hadapan, kami akan bekerjasama dengan rakan kongsi industri untuk menggunakan sistem teknikal yang berkaitan untuk pelbagai bidang menegak seperti kewangan, penjagaan perubatan dan hal ehwal kerajaan, dan menggalakkan pelaksanaan industri teknologi penjanaan terkawal yang dipacu dwi oleh graf pengetahuan dan model bahasa besar.
Laman utama rasmi OneKE: http://oneke.openkg.cn/
OpenSPG GitHub: https://github.com/OpenSPG/openspg
Atas ialah kandungan terperinci Kumpulan Ant dan Universiti Zhejiang bersama-sama mengeluarkan OneKE, rangka kerja pengekstrakan pengetahuan model besar sumber terbuka. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Perpustakaan yang digunakan untuk operasi nombor terapung dalam bahasa Go memperkenalkan cara memastikan ketepatannya ...

Giteepages Statik Laman Web Penggunaan Gagal: 404 Penyelesaian Masalah dan Resolusi Ralat Semasa Menggunakan Gitee ...

Menjalankan projek H5 memerlukan langkah -langkah berikut: memasang alat yang diperlukan seperti pelayan web, node.js, alat pembangunan, dan lain -lain. Membina persekitaran pembangunan, membuat folder projek, memulakan projek, dan menulis kod. Mulakan pelayan pembangunan dan jalankan arahan menggunakan baris arahan. Pratonton projek dalam penyemak imbas anda dan masukkan URL Server Pembangunan. Menerbitkan projek, mengoptimumkan kod, menggunakan projek, dan menyediakan konfigurasi pelayan web.

Perpustakaan mana yang dibangunkan oleh syarikat besar atau projek sumber terbuka yang terkenal? Semasa pengaturcaraan di GO, pemaju sering menghadapi beberapa keperluan biasa, ...

Di bawah rangka kerja beegoorm, bagaimana untuk menentukan pangkalan data yang berkaitan dengan model? Banyak projek beego memerlukan pelbagai pangkalan data untuk dikendalikan secara serentak. Semasa menggunakan beego ...

Halaman H5 perlu dikekalkan secara berterusan, kerana faktor -faktor seperti kelemahan kod, keserasian pelayar, pengoptimuman prestasi, kemas kini keselamatan dan peningkatan pengalaman pengguna. Kaedah penyelenggaraan yang berkesan termasuk mewujudkan sistem ujian lengkap, menggunakan alat kawalan versi, kerap memantau prestasi halaman, mengumpul maklum balas pengguna dan merumuskan pelan penyelenggaraan.

Masalah menggunakan redisstream untuk melaksanakan beratur mesej dalam bahasa Go menggunakan bahasa Go dan redis ...

TypeCho Routing Pencocokan Peraturan Analisis dan Penyiasatan Masalah Artikel ini akan menganalisis dan menjawab soalan mengenai hasil yang tidak konsisten dari pendaftaran routing plug-in typecho dan hasil padanan sebenar ...
