Video terbaru Andrej Karpathy, "Bagaimana Saya Menggunakan LLMS," memberikan gambaran menyeluruh mengenai ekosistem model bahasa besar (LLM) yang pesat berkembang. Membina video "Deep Diving ke LLMS" sebelumnya, Karpathy mempamerkan bagaimana LLM telah beralih dari antara muka sembang berasaskan teks mudah ke platform yang canggih, pelbagai modal yang mengintegrasikan pelbagai alat dan fungsi. Artikel ini meringkaskan pandangan dan demonstrasi utamanya.
Jadual Kandungan
Landskap llm yang berkembang
Karpathy menyoroti pertumbuhan di luar chatgpt perintis, menyebut pesaing seperti Gemini, Copilot, Claude, Grok, Deepseek, dan Lechat, masing -masing menawarkan kekuatan unik dan model harga. Dia mencadangkan menggunakan sumber seperti Chatbot Arena dan Leaderboard Skala untuk membandingkan prestasi model.
Beyond Text: Keupayaan pelbagai modal
Karpathy menyelidiki keupayaan multi-modal LLM, bergerak melampaui penjanaan teks.
Generasi teks: LLMS cemerlang dalam tugas menulis kreatif (puisi, e -mel, dan lain -lain), dengan interaksi yang divisualisasikan sebagai "gelembung sembang" dinamik. Dia menerangkan mekanik asas tokenisasi, tingkap konteks, dan peranan penandaan POS dan NER. Algoritma tokenisasi yang berbeza (seperti pengekodan pasangan byte) dan token khas (: dan) dibincangkan.
Proses latihan dua peringkat (pra-latihan dan selepas latihan) terperinci, menekankan kos dan batasan pra-latihan dan kepentingan latihan pasca untuk interaksi manusia dan mengurangkan halusinasi. Beliau juga membincangkan teknik penyahkodan dan pensampelan (pensampelan nukleus, pensampelan top-k, carian rasuk).
Imej dan Video: Karpathy menunjukkan penjanaan imej dengan menggabungkan model dan model generasi imej. Beliau juga menunjukkan keupayaan video, di mana LLM "melihat" melalui suapan kamera dan mengenal pasti objek.
Audio: Dia menyoroti interaksi suara, membezakan antara "audio palsu" (teks-ke-ucapan) dan "audio benar" (tokenisasi audio asli). Keupayaan untuk menjana tindak balas audio dalam pelbagai personas dipamerkan.
Model "Berfikir": menyelesaikan masalah yang sengaja
Karpathy meneroka "model pemikiran," yang menggunakan pembelajaran tetulang untuk membuat alasan melalui masalah kompleks langkah demi langkah. Dia membezakannya dengan model standard, menggambarkan bagaimana model pemikiran dapat memberikan penyelesaian yang lebih tepat, walaupun pada kos peningkatan masa pemprosesan. Dia menggunakan contoh kegagalan pemeriksaan kecerunan untuk menyerlahkan perbezaannya.
Integrasi Alat: Carian Web dan penyelidikan mendalam
Penyepaduan keupayaan carian Internet dibincangkan, menunjukkan bagaimana LLM boleh mengakses dan memproses maklumat masa nyata, mengatasi pemotongan pengetahuan. Dia membandingkan integrasi carian model yang berbeza (Claude, Gemini, Chatgpt, kebingungan.ai).
Penyelidikan Lanjutan: Penyelidikan yang mendalam, sering memerlukan langganan yang lebih tinggi, dijelaskan sebagai proses yang menggabungkan carian web yang luas dengan alasan untuk membuat laporan yang komprehensif, lengkap dengan petikan.
Muat naik fail, penterjemah python, alat tersuai, dan pemperibadian
Artikel itu kemudian meliputi muat naik fail untuk memproses dokumen dan multimedia, penterjemah python bersepadu untuk pelaksanaan kod dan analisis data, alat visual dan kod tersuai (artifak claude dan komposer kursor), dan kepentingan ciri -ciri personalisasi seperti memori, arahan tersuai, dan gpts tersuai. Contoh masing -masing disediakan.
Petua untuk pemula dan kesimpulan LLM
Artikel ini menyimpulkan dengan nasihat untuk pemula dan ringkasan pengambilan kunci Karpathy, menekankan gabungan prinsip matematik dan pemampatan data yang mendasari kuasa LLM. Sifat yang pesat berkembang di lapangan diserlahkan, menggalakkan pembelajaran dan eksperimen yang berterusan.
Atas ialah kandungan terperinci Inilah cara Andrej Karpathy menggunakan LLMS. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!