Baru-baru ini, OneKE, rangka kerja pengekstrakan pengetahuan model besar yang dibangunkan bersama oleh Ant Group dan Universiti Zhejiang, diumumkan sebagai sumber terbuka dan didermakan kepada komuniti graf pengetahuan terbuka OpenKG.
Graf pengetahuan ialah salah satu teknologi utama untuk mencapai kebolehpercayaan dan kebolehkawalan model besar dapat membantu membina graf pengetahuan domain. OneKE komited untuk membantu penyelidik dan pembangun menangani isu seperti pengekstrakan maklumat, penstrukturan data teks dan pembinaan graf pengetahuan dengan lebih baik.
Mengekstrak peristiwa berisiko, entiti orang, entiti institusi, dll. melalui OneKE boleh membentangkan konteks acara, arah aliran pembangunan peristiwa dan hubungan antara entiti dengan jelas dengan jelas. Graf yang dibina boleh membantu model besar merealisasikan penaakulan yang kompleks merentas entiti dan dokumen. OneKE adalah dwibahasa dalam bahasa Cina dan Inggeris, menyokong rangka kerja sumber terbuka OpenSPG dan DeepKE, dan boleh digunakan di luar kotak.
Model bahasa yang besar telah meningkatkan dengan ketara keupayaan sistem kecerdasan buatan untuk memproses pengetahuan dunia. Walau bagaimanapun, maklumat dunia sebenar sangat berpecah-belah dan tidak tersusun, jadi apabila model bahasa besar mengendalikan tugas pengekstrakan maklumat, mereka masih akan mendapat hasil yang buruk disebabkan perbezaan besar antara kandungan yang diekstrak dan ungkapan bahasa semula jadi di samping itu, maklumat teks bahasa semula jadi Di sana terdapat banyak kekaburan, polisemi, metafora, dsb., yang membawa cabaran yang lebih besar kepada tugas pengekstrakan pengetahuan. Ini juga membawa kepada fakta bahawa kecerdasan buatan generatif yang diwakili oleh model bahasa yang besar masih mempunyai masalah seperti keupayaan penaakulan yang tidak mencukupi, kekurangan pengetahuan fakta, dan hasil penjanaan yang tidak stabil, yang sangat menghalang perindustrian model bahasa besar.
Rangka kerja pengekstrakan pengetahuan bersatu boleh mengurangkan kos membina graf pengetahuan domain dengan ketara dan mempunyai pelbagai senario aplikasi. Ini bermakna dengan mengekstrak pengetahuan berstruktur daripada data besar-besaran, membina graf pengetahuan berkualiti tinggi dan mewujudkan hubungan logik antara elemen pengetahuan, keputusan penaakulan yang boleh dijelaskan boleh dicapai, dan ia juga boleh digunakan untuk meningkatkan model besar untuk mengurangkan ilusi dan meningkatkan kestabilan. mempercepatkan aplikasi model besar dalam bidang menegak.
Dalam bidang perubatan, pengurusan pengetahuan tentang pengalaman doktor dicapai melalui pengekstrakan pengetahuan, dan diagnosis dan rawatan tambahan yang boleh dikawal serta Soal Jawab perubatan dibina. Dalam bidang kewangan, jabatan pengekstrakan pengetahuan digunakan untuk penunjuk kewangan, peristiwa risiko, hubungan sebab akibat, rantaian industri, dsb. untuk mencapai penjanaan laporan penyelidikan kewangan automatik, ramalan risiko, analisis rantaian industri, dsb. Dalam senario hal ehwal kerajaan, pengetahuan tentang peraturan hal ehwal kerajaan dapat direalisasikan, meningkatkan kecekapan dan membuat keputusan yang tepat bagi perkhidmatan hal ehwal kerajaan.
Untuk mempercepatkan pelaksanaan industri kecerdasan buatan berasaskan pengeluaran, Ant Group dan Zhejiang University telah menubuhkan makmal graf pengetahuan bersama untuk memberi tumpuan kepada topik seperti pembinaan graf pengetahuan yang dipertingkatkan oleh model besar, fungsi penjanaan yang dipercayai dan boleh dikawal yang dipertingkatkan oleh pengetahuan , dan peta dunia pengetahuan domain Menjalankan kerjasama menyeluruh dengan tujuan untuk mewujudkan paradigma fungsi generasi terkawal dengan peningkatan dua hala model bahasa besar dan graf pengetahuan melalui penyelidikan teknikal bersama.
Ant Group dan Universiti Zhejiang bersama-sama menubuhkan dan meningkatkan keupayaan model besar Ant Bailing dalam bidang pengekstrakan pengetahuan, dan mengeluarkan OneKE, rangka kerja pengekstrakan pengetahuan model besar dwibahasa Cina-Inggeris, dan versi sumber terbuka berdasarkan LLaMA2 penuh -penalaan halus parameter. Penunjuk ujian menunjukkan bahawa OneKE telah mencapai keputusan yang agak baik pada berbilang tugas pengekstrakan entiti/perhubungan/peristiwa yang diselia sepenuhnya dan sampel sifar.
OneKE ialah alat pengekstrakan pengetahuan dwibahasa Cina-Inggeris yang sangat baik Ia telah mencapai keputusan yang agak baik dalam tugas pengecaman entiti bernama NER Cina, tugas pengekstrakan hubungan RE dan tugas pengekstrakan acara EE.
Liang Lei, ketua graf pengetahuan di Ant Group, berkata Ant akan terus mengoptimumkan prestasi pengekstrakan pengetahuan untuk memenuhi keperluan model besar yang boleh dikawal dan boleh dipercayai dalam senario yang berbeza. Pada masa hadapan, kami akan bekerjasama dengan rakan kongsi industri untuk menggunakan sistem teknikal yang berkaitan untuk pelbagai bidang menegak seperti kewangan, penjagaan perubatan dan hal ehwal kerajaan, dan menggalakkan pelaksanaan industri teknologi penjanaan terkawal yang dipacu dwi oleh graf pengetahuan dan model bahasa besar.
Laman utama rasmi OneKE: http://oneke.openkg.cn/
OpenSPG GitHub: https://github.com/OpenSPG/openspg
Atas ialah kandungan terperinci Kumpulan Ant dan Universiti Zhejiang bersama-sama mengeluarkan OneKE, rangka kerja pengekstrakan pengetahuan model besar sumber terbuka. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!