Inilah cara Andrej Karpathy menggunakan LLMS-AI-php.cn

Inilah cara Andrej Karpathy menggunakan LLMS

Lisa Kudrow

Lepaskan： 2025-03-21 10:54:15

asal

122 orang telah melayarinya

Video terbaru Andrej Karpathy, "Bagaimana Saya Menggunakan LLMS," memberikan gambaran menyeluruh mengenai ekosistem model bahasa besar (LLM) yang pesat berkembang. Membina video "Deep Diving ke LLMS" sebelumnya, Karpathy mempamerkan bagaimana LLM telah beralih dari antara muka sembang berasaskan teks mudah ke platform yang canggih, pelbagai modal yang mengintegrasikan pelbagai alat dan fungsi. Artikel ini meringkaskan pandangan dan demonstrasi utamanya.

Jadual Kandungan

Landskap llm yang berkembang
Beyond Text: Keupayaan pelbagai modal
Model "Berfikir": menyelesaikan masalah yang sengaja
Integrasi Alat: Carian Web dan penyelidikan mendalam
Penyelidikan Lanjutan: Menyintesis maklumat dari pelbagai sumber
Dokumen dan pemprosesan multimedia melalui muat naik fail
Jurubahasa Python: Pelaksanaan Kod dan Analisis Data
Alat Visual dan Kod Kustom: Artefak Claude dan Komposer Kursor
Interaksi audio dan generasi podcast dengan notebooklm
Pemprosesan Visual: Input Imej/OCR, Penjanaan Imej, dan Video
Pemperibadian: Memori, Arahan Kustom, dan GPT Kustom
Petua untuk pemula LLM
Kesimpulan

Landskap llm yang berkembang

Karpathy menyoroti pertumbuhan di luar chatgpt perintis, menyebut pesaing seperti Gemini, Copilot, Claude, Grok, Deepseek, dan Lechat, masing -masing menawarkan kekuatan unik dan model harga. Dia mencadangkan menggunakan sumber seperti Chatbot Arena dan Leaderboard Skala untuk membandingkan prestasi model.

Inilah cara Andrej Karpathy menggunakan LLMS

Beyond Text: Keupayaan pelbagai modal

Karpathy menyelidiki keupayaan multi-modal LLM, bergerak melampaui penjanaan teks.

Generasi teks: LLMS cemerlang dalam tugas menulis kreatif (puisi, e -mel, dan lain -lain), dengan interaksi yang divisualisasikan sebagai "gelembung sembang" dinamik. Dia menerangkan mekanik asas tokenisasi, tingkap konteks, dan peranan penandaan POS dan NER. Algoritma tokenisasi yang berbeza (seperti pengekodan pasangan byte) dan token khas (: dan) dibincangkan.

Inilah cara Andrej Karpathy menggunakan LLMS

Proses latihan dua peringkat (pra-latihan dan selepas latihan) terperinci, menekankan kos dan batasan pra-latihan dan kepentingan latihan pasca untuk interaksi manusia dan mengurangkan halusinasi. Beliau juga membincangkan teknik penyahkodan dan pensampelan (pensampelan nukleus, pensampelan top-k, carian rasuk).

Inilah cara Andrej Karpathy menggunakan LLMS

Imej dan Video: Karpathy menunjukkan penjanaan imej dengan menggabungkan model dan model generasi imej. Beliau juga menunjukkan keupayaan video, di mana LLM "melihat" melalui suapan kamera dan mengenal pasti objek.

Audio: Dia menyoroti interaksi suara, membezakan antara "audio palsu" (teks-ke-ucapan) dan "audio benar" (tokenisasi audio asli). Keupayaan untuk menjana tindak balas audio dalam pelbagai personas dipamerkan.

Model "Berfikir": menyelesaikan masalah yang sengaja

Karpathy meneroka "model pemikiran," yang menggunakan pembelajaran tetulang untuk membuat alasan melalui masalah kompleks langkah demi langkah. Dia membezakannya dengan model standard, menggambarkan bagaimana model pemikiran dapat memberikan penyelesaian yang lebih tepat, walaupun pada kos peningkatan masa pemprosesan. Dia menggunakan contoh kegagalan pemeriksaan kecerunan untuk menyerlahkan perbezaannya.

Inilah cara Andrej Karpathy menggunakan LLMS

Integrasi Alat: Carian Web dan penyelidikan mendalam

Penyepaduan keupayaan carian Internet dibincangkan, menunjukkan bagaimana LLM boleh mengakses dan memproses maklumat masa nyata, mengatasi pemotongan pengetahuan. Dia membandingkan integrasi carian model yang berbeza (Claude, Gemini, Chatgpt, kebingungan.ai).

Inilah cara Andrej Karpathy menggunakan LLMS

Penyelidikan Lanjutan: Penyelidikan yang mendalam, sering memerlukan langganan yang lebih tinggi, dijelaskan sebagai proses yang menggabungkan carian web yang luas dengan alasan untuk membuat laporan yang komprehensif, lengkap dengan petikan.

Inilah cara Andrej Karpathy menggunakan LLMS

Muat naik fail, penterjemah python, alat tersuai, dan pemperibadian

Artikel itu kemudian meliputi muat naik fail untuk memproses dokumen dan multimedia, penterjemah python bersepadu untuk pelaksanaan kod dan analisis data, alat visual dan kod tersuai (artifak claude dan komposer kursor), dan kepentingan ciri -ciri personalisasi seperti memori, arahan tersuai, dan gpts tersuai. Contoh masing -masing disediakan.

Inilah cara Andrej Karpathy menggunakan LLMS

Petua untuk pemula dan kesimpulan LLM

Artikel ini menyimpulkan dengan nasihat untuk pemula dan ringkasan pengambilan kunci Karpathy, menekankan gabungan prinsip matematik dan pemampatan data yang mendasari kuasa LLM. Sifat yang pesat berkembang di lapangan diserlahkan, menggalakkan pembelajaran dan eksperimen yang berterusan.

Atas ialah kandungan terperinci Inilah cara Andrej Karpathy menggunakan LLMS. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!