Rumah hujung hadapan web tutorial js Memudahkan Pengekstrakan Data dengan Mod JSON OpenAI dan Skema JSON

Memudahkan Pengekstrakan Data dengan Mod JSON OpenAI dan Skema JSON

Jan 04, 2025 pm 12:59 PM

Simplifying Data Extraction with OpenAI JSON Mode and JSON Schemas

Apabila saya mula-mula bereksperimen dengan ChatGPT-3.5 selepas dikeluarkan, saya sangat teruja dengan potensinya untuk pelbagai aplikasi. Walau bagaimanapun, keterujaan saya cepat pudar apabila saya menghadapi sekatan jalan utama: walaupun maklumat berharga yang dikembalikannya sangat boleh dibaca, ia bukan dalam bentuk yang boleh diserap dengan pasti oleh aplikasi. Ironinya, LLM cemerlang dalam mengekstrak maklumat daripada teks tidak berstruktur tetapi hanya boleh mengembalikannya dalam bentuk tidak berstruktur. Cuba untuk mengekstrak hasil daripada LLM secara pemrograman terasa seperti berada di restoran luar biasa yang menyajikan makanan paling lazat, tetapi tanpa sebarang perkakas — anda boleh melihat dan menghidunya, tetapi anda tidak boleh mendapatkannya.

Saya mencuba setiap helah dalam buku untuk memujuknya supaya memberikan saya sedikit kemiripan data berstruktur. "Sila, hanya asingkan setiap item dengan bar atau baris baharu dan langkau ulasan," saya merayu. Kadang-kadang berjaya, kadang-kadang tidak. Kadangkala ia akan "membantu" menomborkan atau menyusun semula item, seperti pembantu yang bermaksud baik tetapi sedikit keliru. Pada masa lain ia masih akan menyelinap dalam beberapa ulasan, mengingatkan rakan sekerja yang cerewet. Saya malah menuntutnya dengan tidak pasti untuk mengembalikan JSON dan tiada yang lain, tetapi kadangkala ia meninggalkan koma — hampir seolah-olah ia mengambil jelingan pasif-agresif. Akhirnya, saya berputus asa dan dengan berat hati kembali kepada batasan algoritma tradisional yang kurang menarik tetapi lebih boleh diramal.

Nasib baik, beberapa bulan kemudian, OpenAI memperkenalkan mod JSON, satu ciri yang memaksa LLM untuk mengembalikan JSON yang sah. Saya memutuskan untuk mencuba ciri ini dan mendapati ia lebih berkesan untuk memproses hasil dalam aplikasi saya. Berikut ialah contoh output dengan mod JSON didayakan:

PROMPT:‍
Parse the following sentence into words and then return the results
as a list of the original word and the translation in English and
return the results in JSON.
-- sentence --
早安‍


RESULTS:
{
  "results": [
    {
      "original": "早安",
      "translation": "Good morning"
    }
  ]
}
Salin selepas log masuk
Salin selepas log masuk

Keluaran ini sememangnya satu peningkatan. Walau bagaimanapun, walaupun output adalah JSON yang sah, strukturnya boleh berbeza-beza bergantung pada kandungan gesaan. Pendekatan yang lebih boleh diramal adalah untuk menentukan format pulangan yang diingini. Satu cara untuk mencapai ini adalah dengan menyediakan sampel struktur JSON untuk diikuti oleh LLM. Kaedah ini melibatkan mencipta contoh dan menulis kod untuk menghuraikannya. Jika struktur berubah, pengubahsuaian mesti dilakukan di kedua-dua tempat.

Pendekatan alternatif ialah mentakrifkan Objek Pemindahan Data (DTO) untuk menyimpan hasil dan menggunakannya untuk mengarahkan LLM dan menghuraikan keputusan, mengelakkan isu penyegerakan. Mula-mula, tentukan DTO, contohnya:‍

record Entries(List<Entry> entries) {
    record Entry(String originalWord, String wordInEnglish, String pronunciation) {}
}
Salin selepas log masuk
Salin selepas log masuk

Kini DTO boleh digunakan dalam arahan segera serta dengan kod penghuraian:

// Construct the prompt with the output schema.
var prompt = MessageFormat.format("""
   Parse the following sentence into English and return the results
   in JSON according to the following JSON schema.

   人工智慧將引領未來,以智慧之光照亮人類無限可能的前程。
   --- output json schema ---
   {0}
   """, jsonSchemaOf(Entries.class));
   var result = sendPrompt(prompt, Entries.class);
Salin selepas log masuk

Berikut ialah kod yang menggunakan penjana Jackson JSON Schema:

PROMPT:‍
Parse the following sentence into words and then return the results
as a list of the original word and the translation in English and
return the results in JSON.
-- sentence --
早安‍


RESULTS:
{
  "results": [
    {
      "original": "早安",
      "translation": "Good morning"
    }
  ]
}
Salin selepas log masuk
Salin selepas log masuk

Nota: Secara lalai, skema yang dijana akan termasuk medan ID yang digunakan untuk rujukan, yang boleh membazir token. Lihat Contoh Mod OpenAI JSON repositori untuk kod yang mengalih keluar ID yang tidak digunakan ini.

Dan akhirnya, inilah kod yang menghantar gesaan kepada OpenAI menggunakan Azure OpenAI Java SDK:

record Entries(List<Entry> entries) {
    record Entry(String originalWord, String wordInEnglish, String pronunciation) {}
}
Salin selepas log masuk
Salin selepas log masuk

Penyelesaian berfungsi dengan baik pada kebanyakan masa. LLM memahami skema JSON dengan berkesan tetapi satu kata amaran: Saya pernah melihat kes yang kadangkala menjadi salah. Contohnya, jika medan ialah String dan namanya jamak (cth. “exampleValues”), LLM kadangkala berkeras untuk mengembalikan tatasusunan Rentetan.

LLM boleh menjana output yang luar biasa, kadangkala melebihi keupayaan orang biasa. Walau bagaimanapun, adalah menarik bahawa, sekurang-kurangnya buat masa ini, mereka bergelut dengan tugas yang lebih biasa untuk memformat output terjana mereka dengan pasti.

Atas ialah kandungan terperinci Memudahkan Pengekstrakan Data dengan Mod JSON OpenAI dan Skema JSON. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

<🎜>: Bubble Gum Simulator Infinity - Cara Mendapatkan dan Menggunakan Kekunci Diraja
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Nordhold: Sistem Fusion, dijelaskan
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Mandragora: Whispers of the Witch Tree - Cara Membuka Kunci Cangkuk Bergelut
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Tutorial Java
1671
14
Tutorial PHP
1276
29
Tutorial C#
1256
24
Python vs JavaScript: Keluk Pembelajaran dan Kemudahan Penggunaan Python vs JavaScript: Keluk Pembelajaran dan Kemudahan Penggunaan Apr 16, 2025 am 12:12 AM

Python lebih sesuai untuk pemula, dengan lengkung pembelajaran yang lancar dan sintaks ringkas; JavaScript sesuai untuk pembangunan front-end, dengan lengkung pembelajaran yang curam dan sintaks yang fleksibel. 1. Sintaks Python adalah intuitif dan sesuai untuk sains data dan pembangunan back-end. 2. JavaScript adalah fleksibel dan digunakan secara meluas dalam pengaturcaraan depan dan pelayan.

Dari C/C ke JavaScript: Bagaimana semuanya berfungsi Dari C/C ke JavaScript: Bagaimana semuanya berfungsi Apr 14, 2025 am 12:05 AM

Peralihan dari C/C ke JavaScript memerlukan menyesuaikan diri dengan menaip dinamik, pengumpulan sampah dan pengaturcaraan asynchronous. 1) C/C adalah bahasa yang ditaip secara statik yang memerlukan pengurusan memori manual, manakala JavaScript ditaip secara dinamik dan pengumpulan sampah diproses secara automatik. 2) C/C perlu dikumpulkan ke dalam kod mesin, manakala JavaScript adalah bahasa yang ditafsirkan. 3) JavaScript memperkenalkan konsep seperti penutupan, rantaian prototaip dan janji, yang meningkatkan keupayaan pengaturcaraan fleksibiliti dan asynchronous.

JavaScript dan Web: Fungsi teras dan kes penggunaan JavaScript dan Web: Fungsi teras dan kes penggunaan Apr 18, 2025 am 12:19 AM

Penggunaan utama JavaScript dalam pembangunan web termasuk interaksi klien, pengesahan bentuk dan komunikasi tak segerak. 1) kemas kini kandungan dinamik dan interaksi pengguna melalui operasi DOM; 2) pengesahan pelanggan dijalankan sebelum pengguna mengemukakan data untuk meningkatkan pengalaman pengguna; 3) Komunikasi yang tidak bersesuaian dengan pelayan dicapai melalui teknologi Ajax.

JavaScript in Action: Contoh dan projek dunia nyata JavaScript in Action: Contoh dan projek dunia nyata Apr 19, 2025 am 12:13 AM

Aplikasi JavaScript di dunia nyata termasuk pembangunan depan dan back-end. 1) Memaparkan aplikasi front-end dengan membina aplikasi senarai TODO, yang melibatkan operasi DOM dan pemprosesan acara. 2) Membina Restfulapi melalui Node.js dan menyatakan untuk menunjukkan aplikasi back-end.

Memahami Enjin JavaScript: Butiran Pelaksanaan Memahami Enjin JavaScript: Butiran Pelaksanaan Apr 17, 2025 am 12:05 AM

Memahami bagaimana enjin JavaScript berfungsi secara dalaman adalah penting kepada pemaju kerana ia membantu menulis kod yang lebih cekap dan memahami kesesakan prestasi dan strategi pengoptimuman. 1) aliran kerja enjin termasuk tiga peringkat: parsing, penyusun dan pelaksanaan; 2) Semasa proses pelaksanaan, enjin akan melakukan pengoptimuman dinamik, seperti cache dalam talian dan kelas tersembunyi; 3) Amalan terbaik termasuk mengelakkan pembolehubah global, mengoptimumkan gelung, menggunakan const dan membiarkan, dan mengelakkan penggunaan penutupan yang berlebihan.

Python vs JavaScript: Komuniti, Perpustakaan, dan Sumber Python vs JavaScript: Komuniti, Perpustakaan, dan Sumber Apr 15, 2025 am 12:16 AM

Python dan JavaScript mempunyai kelebihan dan kekurangan mereka sendiri dari segi komuniti, perpustakaan dan sumber. 1) Komuniti Python mesra dan sesuai untuk pemula, tetapi sumber pembangunan depan tidak kaya dengan JavaScript. 2) Python berkuasa dalam bidang sains data dan perpustakaan pembelajaran mesin, sementara JavaScript lebih baik dalam perpustakaan pembangunan dan kerangka pembangunan depan. 3) Kedua -duanya mempunyai sumber pembelajaran yang kaya, tetapi Python sesuai untuk memulakan dengan dokumen rasmi, sementara JavaScript lebih baik dengan MDNWebDocs. Pilihan harus berdasarkan keperluan projek dan kepentingan peribadi.

Python vs JavaScript: Persekitaran dan Alat Pembangunan Python vs JavaScript: Persekitaran dan Alat Pembangunan Apr 26, 2025 am 12:09 AM

Kedua -dua pilihan Python dan JavaScript dalam persekitaran pembangunan adalah penting. 1) Persekitaran pembangunan Python termasuk Pycharm, Jupyternotebook dan Anaconda, yang sesuai untuk sains data dan prototaip cepat. 2) Persekitaran pembangunan JavaScript termasuk node.js, vscode dan webpack, yang sesuai untuk pembangunan front-end dan back-end. Memilih alat yang betul mengikut keperluan projek dapat meningkatkan kecekapan pembangunan dan kadar kejayaan projek.

Peranan C/C dalam JavaScript Jurubah dan Penyusun Peranan C/C dalam JavaScript Jurubah dan Penyusun Apr 20, 2025 am 12:01 AM

C dan C memainkan peranan penting dalam enjin JavaScript, terutamanya digunakan untuk melaksanakan jurubahasa dan penyusun JIT. 1) C digunakan untuk menghuraikan kod sumber JavaScript dan menghasilkan pokok sintaks abstrak. 2) C bertanggungjawab untuk menjana dan melaksanakan bytecode. 3) C melaksanakan pengkompil JIT, mengoptimumkan dan menyusun kod hot-spot semasa runtime, dan dengan ketara meningkatkan kecekapan pelaksanaan JavaScript.

See all articles