Rumah Peranti teknologi AI Tutorial GPT-4O dan Langgraph: Bina Aplikasi TNT-LLM

Tutorial GPT-4O dan Langgraph: Bina Aplikasi TNT-LLM

Mar 05, 2025 am 10:56 AM

TNT-LLM Microsoft: merevolusikan penjanaan taksonomi dan klasifikasi teks

Microsoft telah melancarkan TNT-LLM, sistem pecah tanah yang mengautomasikan penciptaan taksonomi dan klasifikasi teks, melampaui kaedah tradisional dalam kedua-dua kelajuan dan ketepatan. Pendekatan inovatif ini memanfaatkan kuasa model bahasa besar (LLMS) untuk menyelaraskan dan skala penjanaan taksonomi dan pengelas, meminimumkan campur tangan manual. Ini amat bermanfaat untuk aplikasi seperti Bing Copilot, di mana menguruskan data teks yang dinamik dan pelbagai adalah yang paling utama.

Artikel ini menunjukkan pelaksanaan TNT-LLM menggunakan GPT-4O dan Langgraph untuk clustering artikel berita yang efisien. Untuk maklumat lanjut mengenai GPT-4O dan Langgraph, rujuk sumber-sumber ini:

  • Apa itu GPT-4O Openai?
  • tutorial API GPT-4O: Bermula dengan API OpenAI
  • tutorial langgraph: Apakah langgraph dan cara menggunakannya?

Kertas penyelidikan TNT-LLM yang asal, "TNT-LLM: Perlombongan Teks pada skala dengan model bahasa yang besar," memberikan butiran komprehensif mengenai sistem.

Memahami TNT-LLM

TNT-LLM (klasifikasi taksonomi dan teks menggunakan model bahasa yang besar) adalah rangka kerja dua peringkat yang direka untuk menjana dan mengklasifikasikan taksonomi dari data teks.

Fasa 1: Generasi Taksonomi

Fasa awal ini menggunakan sampel dokumen teks dan arahan tertentu (mis., "Menjana taksonomi kepada artikel berita kluster"). LLM meringkaskan setiap dokumen, mengeluarkan maklumat utama. Melalui penghalusan berulang, LLM membina, mengubah, dan menyempurnakan taksonomi, mengakibatkan hierarki label dan deskripsi berstruktur untuk pengkategorian artikel berita yang berkesan.

GPT-4o and LangGraph Tutorial: Build a TNT-LLM Application Sumber: Mengtting Wan et al.

Fasa 2: Klasifikasi Teks

Fasa kedua menggunakan taksonomi yang dihasilkan untuk melabelkan dataset yang lebih besar. LLM menggunakan label ini, mewujudkan data latihan untuk pengelas ringan (seperti regresi logistik). Pengelas terlatih ini dengan cekap melabelkan keseluruhan dataset atau melakukan klasifikasi masa nyata.

Sumber: Mengtting Wan et al. GPT-4o and LangGraph Tutorial: Build a TNT-LLM Application

sifat yang boleh disesuaikan TNT-LLM menjadikannya sesuai untuk pelbagai tugas klasifikasi teks, termasuk pengesanan niat dan pengkategorian topik.

Kelebihan TNT-LLM

TNT-LLM menawarkan kelebihan yang ketara untuk perlombongan dan klasifikasi teks berskala besar:

  • Generasi Taksonomi Automatik: mengautomasikan penciptaan taksonomi terperinci dan ditafsirkan dari teks mentah, menghapuskan keperluan untuk usaha manual dan kepakaran domain yang luas.
  • Klasifikasi berskala: Membolehkan klasifikasi teks berskala menggunakan model ringan yang mengendalikan dataset besar dan klasifikasi masa nyata dengan cekap.
  • keberkesanan kos: Mengoptimumkan penggunaan sumber melalui penggunaan LLM bertingkat (mis., GPT-4 untuk penjanaan taksonomi, GPT-3.5-Turbo untuk ringkasan, dan regresi logistik untuk klasifikasi akhir).
  • output berkualiti tinggi:
  • penjanaan taksonomi berulang memastikan pengkategorian berkualiti tinggi, relevan, dan tepat.
  • Intervensi manusia yang minimum:
  • Mengurangkan input manual, meminimumkan potensi kecenderungan dan ketidakkonsistenan.
  • fleksibiliti:
  • menyesuaikan diri dengan tugas dan domain klasifikasi teks yang pelbagai, menyokong integrasi dengan pelbagai LLM, kaedah embedding, dan pengelas. Melaksanakan TNT-LLM
Panduan pelaksanaan langkah demi langkah berikut:

Pemasangan:

Pasang pakej yang diperlukan:

Tetapkan pembolehubah persekitaran untuk kekunci API dan nama model:

pip install langgraph langchain langchain_openai
Salin selepas log masuk

Konsep teras:
export AZURE_OPENAI_API_KEY='your_api_key_here'
export AZURE_OPENAI_MODEL='your_deployment_name_here'
export AZURE_OPENAI_ENDPOINT='deployment_endpoint'
Salin selepas log masuk

Dokumen:
    Data teks mentah (artikel, log sembang) berstruktur menggunakan kelas
  • . Doc taksonomi:
  • kelompok niat atau topik yang dikategorikan, yang diuruskan oleh kelas
  • . TaxonomyGenerationState
  • Membina aplikasi TNT-LLM yang mudah:

Bahagian berikut terperinci langkah pelaksanaan, menggunakan coretan kod untuk menggambarkan proses utama. Oleh kerana panjang kod asal, pembiakan lengkap di sini adalah tidak praktikal. Walau bagaimanapun, yang berikut memberikan gambaran tersusun mengenai proses:

    Langkah 0: Tentukan kelas graf kelas, dataset beban, dan memulakan GPT-4O:
  • Ini melibatkan menentukan struktur data dan memuatkan dataset artikel berita. Model GPT-4O diasaskan untuk digunakan sepanjang saluran paip.

  • Langkah 1: meringkaskan dokumen:
  • Setiap dokumen diringkaskan menggunakan prompt LLM.

  • Langkah 2: Buat miniatches:
  • Dokumen yang diringkaskan dibahagikan kepada minibatches untuk pemprosesan selari.

  • Langkah 3: Menjana taksonomi awal:
  • Taksonomi awal dihasilkan dari minibatch pertama.

  • Langkah 4: Kemas kini Taksonomi:
  • Taksonomi ini dikemas kini secara berulang sebagai minibatches berikutnya diproses.

  • Langkah 5: Tinjauan Taksonomi:
  • Taksonomi akhir dikaji semula untuk ketepatan dan kaitan.

  • Langkah 6: Mengatur saluran paip TNT-LLM dengan Stategraph: Stategraph mengendalikan pelaksanaan pelbagai langkah.

  • Langkah 7: Clustering dan memaparkan taksonomi artikel berita TNT-LLM: Taksonomi akhir dipaparkan, menunjukkan kelompok artikel berita.

Kesimpulan

TNT-LLM menawarkan penyelesaian yang kuat dan cekap untuk perlombongan dan klasifikasi teks berskala besar. Keupayaan automasinya dengan ketara mengurangkan masa dan sumber yang diperlukan untuk menganalisis data teks yang tidak berstruktur, membolehkan pengambilan keputusan yang didorong oleh data merentasi pelbagai domain. Potensi untuk pembangunan dan aplikasi selanjutnya merentasi industri adalah besar. Bagi mereka yang berminat dalam pembangunan aplikasi LLM selanjutnya, kursus mengenai "membangunkan aplikasi LLM dengan Langchain" adalah disyorkan.

GPT-4o and LangGraph Tutorial: Build a TNT-LLM Application GPT-4o and LangGraph Tutorial: Build a TNT-LLM Application

Atas ialah kandungan terperinci Tutorial GPT-4O dan Langgraph: Bina Aplikasi TNT-LLM. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Bermula dengan Meta Llama 3.2 - Analytics Vidhya Bermula dengan Meta Llama 3.2 - Analytics Vidhya Apr 11, 2025 pm 12:04 PM

Meta's Llama 3.2: Lompat ke hadapan dalam Multimodal dan Mobile AI META baru -baru ini melancarkan Llama 3.2, kemajuan yang ketara dalam AI yang memaparkan keupayaan penglihatan yang kuat dan model teks ringan yang dioptimumkan untuk peranti mudah alih. Membina kejayaan o

10 Pelanjutan pengekodan AI generatif dalam kod vs yang mesti anda pelajari 10 Pelanjutan pengekodan AI generatif dalam kod vs yang mesti anda pelajari Apr 13, 2025 am 01:14 AM

Hei ada, pengekodan ninja! Apa tugas yang berkaitan dengan pengekodan yang anda telah merancang untuk hari itu? Sebelum anda menyelam lebih jauh ke dalam blog ini, saya ingin anda memikirkan semua kesengsaraan yang berkaitan dengan pengekodan anda-lebih jauh menyenaraikan mereka. Selesai? - Let &#8217

AV Bytes: Meta ' s llama 3.2, Google's Gemini 1.5, dan banyak lagi AV Bytes: Meta ' s llama 3.2, Google's Gemini 1.5, dan banyak lagi Apr 11, 2025 pm 12:01 PM

Landskap AI minggu ini: Badai kemajuan, pertimbangan etika, dan perdebatan pengawalseliaan. Pemain utama seperti Openai, Google, Meta, dan Microsoft telah melepaskan kemas kini, dari model baru yang terobosan ke peralihan penting di LE

Menjual Strategi AI kepada Pekerja: Manifesto CEO Shopify Menjual Strategi AI kepada Pekerja: Manifesto CEO Shopify Apr 10, 2025 am 11:19 AM

Memo CEO Shopify Tobi Lütke baru -baru ini dengan berani mengisytiharkan penguasaan AI sebagai harapan asas bagi setiap pekerja, menandakan peralihan budaya yang signifikan dalam syarikat. Ini bukan trend seketika; Ini adalah paradigma operasi baru yang disatukan ke p

Panduan Komprehensif untuk Model Bahasa Visi (VLMS) Panduan Komprehensif untuk Model Bahasa Visi (VLMS) Apr 12, 2025 am 11:58 AM

Pengenalan Bayangkan berjalan melalui galeri seni, dikelilingi oleh lukisan dan patung yang terang. Sekarang, bagaimana jika anda boleh bertanya setiap soalan dan mendapatkan jawapan yang bermakna? Anda mungkin bertanya, "Kisah apa yang anda ceritakan?

GPT-4O vs OpenAI O1: Adakah model Openai baru bernilai gembar-gembur? GPT-4O vs OpenAI O1: Adakah model Openai baru bernilai gembar-gembur? Apr 13, 2025 am 10:18 AM

Pengenalan OpenAI telah mengeluarkan model barunya berdasarkan seni bina "strawberi" yang sangat dijangka. Model inovatif ini, yang dikenali sebagai O1, meningkatkan keupayaan penalaran, yang membolehkannya berfikir melalui masalah MOR

Membaca Indeks AI 2025: Adakah AI rakan, musuh, atau juruterbang bersama? Membaca Indeks AI 2025: Adakah AI rakan, musuh, atau juruterbang bersama? Apr 11, 2025 pm 12:13 PM

Laporan Indeks Perisikan Buatan 2025 yang dikeluarkan oleh Stanford University Institute for Manusia Berorientasikan Kecerdasan Buatan memberikan gambaran yang baik tentang revolusi kecerdasan buatan yang berterusan. Mari kita menafsirkannya dalam empat konsep mudah: kognisi (memahami apa yang sedang berlaku), penghargaan (melihat faedah), penerimaan (cabaran muka), dan tanggungjawab (cari tanggungjawab kita). Kognisi: Kecerdasan buatan di mana -mana dan berkembang pesat Kita perlu menyedari betapa cepatnya kecerdasan buatan sedang berkembang dan menyebarkan. Sistem kecerdasan buatan sentiasa bertambah baik, mencapai hasil yang sangat baik dalam ujian matematik dan pemikiran kompleks, dan hanya setahun yang lalu mereka gagal dalam ujian ini. Bayangkan AI menyelesaikan masalah pengekodan kompleks atau masalah saintifik peringkat siswazah-sejak tahun 2023

Bagaimana untuk menambah lajur dalam SQL? - Analytics Vidhya Bagaimana untuk menambah lajur dalam SQL? - Analytics Vidhya Apr 17, 2025 am 11:43 AM

Pernyataan Jadual Alter SQL: Menambah lajur secara dinamik ke pangkalan data anda Dalam pengurusan data, kebolehsuaian SQL adalah penting. Perlu menyesuaikan struktur pangkalan data anda dengan cepat? Pernyataan Jadual ALTER adalah penyelesaian anda. Butiran panduan ini menambah colu

See all articles