Rumah > Peranti teknologi > AI > Penalaan GPT-4O Mini: Panduan Langkah demi Langkah

Penalaan GPT-4O Mini: Panduan Langkah demi Langkah

William Shakespeare
Lepaskan: 2025-03-03 09:20:09
asal
1016 orang telah melayarinya

Tutorial ini menunjukkan penalaan halus model bahasa besar GPT-4O mini untuk pengesanan tekanan dalam teks media sosial. Kami akan memanfaatkan API Openai dan taman permainan untuk penalaan dan penilaian yang baik, membandingkan prestasi sebelum dan selepas proses.

Fine-tuning GPT-4o Mini: A Step-by-Step Guide

Memperkenalkan GPT-4O mini: GPT-4O Mini menonjol sebagai tujuan umum yang sangat berpatutan. Mempunyai skor 82% pada penanda aras MMLU dan melampaui Claude 3.5 sonnet dalam pilihan sembang (LMSYS Leaderboard), ia menawarkan penjimatan kos yang signifikan (60% lebih murah daripada GPT-3.5 Turbo) pada 15 sen per juta token input dan 60 sen per juta token output. Ia menerima input teks dan imej, mempunyai tetingkap konteks token 128K, menyokong token output 16K, dan pemotongan pengetahuannya adalah Oktober 2023. Keserasiannya dengan teks bukan bahasa Inggeris, terima kasih kepada Tokenizer GPT-4O, menambah fleksibiliti. Untuk menyelam yang lebih mendalam ke dalam GPT-4O Mini, terokai catatan blog kami: "Apakah GPT-4O Mini?"

Menyediakan API Terbuka:

Buat akaun OpenAI. Penalaan denda menanggung kos, jadi pastikan sekurang-kurangnya $ 10 USD kredit sebelum meneruskan.
  1. Menjana kunci rahsia API OpenAI dari tab "API Keys" papan pemuka anda.
  2. Konfigurasikan kekunci API anda sebagai pemboleh ubah persekitaran (DataCamp's DataLab digunakan dalam contoh ini).
  3. Pasang pakej Openai Python:
  4. %pip install openai Buat klien terbuka dan uji dengan contoh sampel.

Fine-tuning GPT-4o Mini: A Step-by-Step Guide Fine-tuning GPT-4o Mini: A Step-by-Step Guide Fine-tuning GPT-4o Mini: A Step-by-Step Guide Baru ke API Openai? "Tutorial API GPT-4O kami: Bermula dengan API OpenAI" memberikan pengenalan yang komprehensif.

penalaan gpt-4o mini untuk pengesanan tekanan:

Kami akan menyesuaikan diri dengan GPT-4O mini menggunakan dataset Kaggle Reddit dan jawatan Twitter yang dilabelkan sebagai "tekanan" atau "bukan tekanan."

1. Penciptaan dataset:

memuatkan dan memproses dataset (mis., 200 baris teratas dataset pos reddit).

    hanya mengekalkan lajur 'tajuk' dan 'label'.
  • label numerik peta (0, 1) kepada "bukan tekanan" dan "tekanan".
  • berpecah kepada set latihan dan pengesahan (80/20 split).
  • Simpan kedua -dua set dalam format JSONL, memastikan setiap entri termasuk sistem prompt, pertanyaan pengguna (tajuk pos), dan respons "pembantu" (label).
  • 2. Muat naik dataset:

Gunakan klien OpenAI untuk memuat naik fail JSONL latihan dan pengesahan.

3. Permulaan kerja penalaan halus:

Buat kerja penalaan halus yang menentukan ID fail, nama model (gpt-4o-mini-2024-07-18), dan hiperparameter (mis., 3 zaman, saiz batch 3, pengganda kadar pembelajaran 0.3). Pantau status pekerjaan melalui papan pemuka atau API.

Fine-tuning GPT-4o Mini: A Step-by-Step Guide Fine-tuning GPT-4o Mini: A Step-by-Step Guide Fine-tuning GPT-4o Mini: A Step-by-Step Guide

Mengakses model halus:

Ambil nama model halus dari API dan gunakannya untuk menghasilkan ramalan melalui API atau Taman Permainan Openai.

Fine-tuning GPT-4o Mini: A Step-by-Step Guide Fine-tuning GPT-4o Mini: A Step-by-Step Guide

Penilaian model:

Bandingkan model asas dan halus menggunakan ketepatan, laporan klasifikasi, dan matriks kekeliruan pada set pengesahan. Fungsi Custom predict menghasilkan ramalan, dan fungsi evaluate menyediakan metrik prestasi.

Kesimpulan:

Tutorial ini menyediakan panduan praktikal untuk penalaan GPT-4O MINI yang baik, mempamerkan keberkesanannya dalam meningkatkan ketepatan klasifikasi teks. Ingatlah untuk meneroka sumber yang berkaitan untuk maklumat lanjut dan pendekatan alternatif. Untuk alternatif sumber terbuka yang percuma, pertimbangkan llama "penalaan halus 3.2 dan menggunakannya secara tempatan" tutorial.

Atas ialah kandungan terperinci Penalaan GPT-4O Mini: Panduan Langkah demi Langkah. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Artikel terbaru oleh pengarang
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan