


Bagaimanakah teknologi GPT yang dipilih oleh Bill Gates telah berkembang, dan kehidupan siapakah yang telah merevolusikannya?
Xi Xiaoyao Technology Talk Original
Penulis | Ini telah menjadi topik yang sangat membimbangkan dalam komuniti akademik, dan terima kasih kepada satu siri kejayaan dalam pemprosesan bahasa semula jadi dalam beberapa tahun kebelakangan ini, kami mungkin lebih hampir daripada sebelumnya untuk mencapai matlamat ini. Di barisan hadapan kejayaan ini ialah Generative Pre-trained Transformer (GPT)—model rangkaian saraf dalam yang direka khusus untuk tugas pemprosesan bahasa semula jadi. Prestasi cemerlang dan keupayaannya untuk menjalankan perbualan yang berkesan telah menjadikannya salah satu model yang paling banyak digunakan dan berkesan dalam bidang ini, menarik perhatian yang banyak daripada penyelidikan dan industri.
Dalam kertas ulasan terperinci baru-baru ini, penyelidik menjalankan penerokaan mendalam tentang GPT Hari ini kita tidak akan bercakap tentang teknologi Daripada bidang selain komputer, artikel ini akan mengkaji dan membincangkan perkembangan dan kesannya terhadap bidang yang berkaitan ., terokai cabaran yang berpotensi dan hala tuju pembangunan masa hadapan untuk mendapatkan pemahaman yang menyeluruh tentang teknologi pembuatan zaman ini.
Tajuk kertas:
GPT (Generative Pra-trained
Transformer) - Sebuah Komprehensif
Semakan tentang Teknologi yang Mendayakan, Aplikasi Berpotensi, Cabaran Muncul dan Hala Tuju Masa Depan
Pautan kertas:https://www.php.cn/link/51beafc370abd4f00aa270ee3b626849
Evolusi GPT
GPT ialah rangkaian saraf yang menjana sejumlah besar teks yang dihasilkan oleh mesin kompleks sejumlah kecil input teks Model boleh meniru nada manusia, dilatih terlebih dahulu berdasarkan sejumlah besar data teks, dan melaksanakan pelbagai tugas berkaitan bahasa. Keluarga model ini pada asalnya dibangunkan oleh OpenAI untuk memberikan kecerdasan sistem dalam projek seperti ChatGPT. Rajah 1 ialah garis masa evolusi beberapa model pra-latihan daripada penciptaan Eliza kepada ChatGPT.
▲Rajah 1 Pelan jalan GPT
Model GPT (Generative Pre-trained Transformer) ialah model bahasa dalam bidang kecerdasan buatan. Perkembangannya boleh dikesan kembali kepada struktur Transformer asal yang dicadangkan oleh Vaswani et al pada tahun 2017. Berdasarkan kejayaan seni bina Transformer, OpenAI mula membangunkan model GPT pada tahun 2018, yang merupakan varian seni bina Transformer dan secara khusus. disasarkan pada tugas penjanaan bahasa. Berbanding dalam Jadual 1, evolusi siri GPT telah mengalami pelbagai titik perubahan dan penemuan penting:
▲Jadual 1 Versi berbeza model siri GPT
- Pada 2018, OpenAI memperkenalkan versi pertama GPT, model yang mampu membaca teks dan menjawab soalan. Berbanding dengan model NLP sebelumnya, pembelajaran tanpa pengawasan menggunakan data tidak berlabel telah diatasi oleh model bahasa lain seperti BERT walaupun prestasinya cemerlang.
- Pada 2019, OpenAI melancarkan GPT-2, model yang lebih besar dengan lebih daripada 10 kali ganda bilangan parameter sebagai GPT-1, yang mempunyai hasil yang baik dalam bidang seperti terjemahan mesin dan ringkasan teks , terutamanya untuk mengenal pasti hubungan jarak jauh antara ayat dan membuat ramalan, ketepatan telah dipertingkatkan dengan ketara.
- Pelancaran GPT-3 seterusnya boleh menjana perenggan yang lebih panjang, mempunyai 175 bilion parameter, dan digunakan secara meluas dalam pelbagai industri dan bidang aplikasi. Kerana ia terlalu kompleks dan besar, ia perlu digunakan melalui API.
- GPT-4 yang dilancarkan baru-baru ini ialah model bahasa berskala besar berbilang mod Bilangan parameter telah meningkat dengan banyak berbanding model sebelumnya, jadi ia boleh memahami dan menjana teks dengan lebih tepat dan lancar.
Rajah 2 menunjukkan pelbagai peringkat kerja GPT. Langkah pertama memerlukan penalaan halus yang diselia, yang kedua melibatkan penjanaan respons optimum kepada input, dan yang ketiga melibatkan pengoptimuman dasar dan pembelajaran pengukuhan. Selepas pra-latihan, model boleh diperhalusi untuk tugasan tertentu, seperti klasifikasi teks atau penjanaan teks.
▲Rajah 2 Bagaimanakah GPT berfungsi?
Teknologi berkaitan yang mempengaruhi GPT
▲ Rajah 3 Mendayakan teknologi model GPT
Seperti yang ditunjukkan dalam Rajah 3, GPT ialah koleksi berbilang teknologi dan bergantung pada teknologi ini:
- Data Besar: Sejumlah besar data berstruktur dan tidak berstruktur yang dijana oleh perniagaan, individu dan mesin. Ia membawa revolusi dalam cara data dianalisis dan keputusan dibuat. Melalui latihan mengenai data berskala besar, model GPT menggunakan pembelajaran mendalam dan data besar untuk menjana bahasa semula jadi.
- Kecerdasan buatan: Prestasi model GPT boleh dipertingkatkan melalui kaedah seperti penalaan halus, penjanaan dialog dan pemahaman bahasa semula jadi.
- Pengkomputeran awan: Menyediakan ketersediaan storan data dan keupayaan pemprosesan, dan menyediakan sumber pengkomputeran yang diperlukan untuk latihan dan aplikasi model GPT.
- Pengkomputeran tepi: Jadikan model GPT lebih cekap kerana penggunaan sumber pengkomputeran yang tersebar di tepi mengurangkan kelewatan penghantaran data dan meningkatkan perlindungan keselamatan dan privasi.
- Rangkaian 5G dan ke atas: Menyediakan kadar data yang lebih pantas dan kependaman yang lebih rendah, membolehkan GPT mengendalikan model bahasa yang lebih besar dan lebih kompleks.
- Interaksi manusia-komputer: Ia boleh menggalakkan interaksi antara model GPT dan pengguna untuk meningkatkan pengalaman pengguna.
Bidang dan cabaran yang terjejas oleh model GPT
Model GPT telah memainkan peranan penting dalam bidang yang berbeza, seperti penciptaan kandungan, analisis data, robot sembang, pembantu maya, dsb., jadi ia telah digunakan secara meluas fokus pada. Seperti yang ditunjukkan dalam Rajah 4, industri yang menggunakan teknologi ini boleh mendapat manfaat daripada model GPT Mari kita terokai kemungkinan kesan dan aplikasi model GPT dalam bidang yang berbeza.
▲Rajah 4 Kesan model GPT pada aplikasi dalam pelbagai bidang
Pendidikan
Model GPT mungkin menggalakkan perubahan dalam pendidikan dan membantu guru Meningkatkan pengalaman pembelajaran pelajar dengan mereka bentuk rancangan pengajaran yang lebih baik, menjawab soalan pelajar dan menyepadukan aplikasi digital ke dalam pelajaran yang komprehensif. Secara khusus, model GPT boleh digunakan pada aspek berikut:
- Tutor pintar: merealisasikan pemarkahan dan maklum balas automatik supaya guru dapat memberi tumpuan yang lebih baik pada keperluan individu setiap pelajar, dan syarikat produk juga boleh membina pada ini Membangunkan kandungan pendidikan yang diperibadikan untuk memenuhi keperluan setiap pelajar.
- Penciptaan Kandungan: Bantu manusia memahami konsep yang kompleks, menjana teks dan memperhalusi maklumat, serta memberikan kami penjelasan dan respons, sekali gus menggalakkan peningkatan keberkesanan pengajaran.
- Penilaian Automatik: Menyediakan lebih banyak masa dan tenaga untuk guru, sambil memberikan pelajar lebih banyak maklum balas dan latihan yang diperkukuh, meningkatkan keyakinan dan persediaan ujian mereka.
- Tingkatkan kreativiti: Dengan input manusia dan maklum balas yang tepat pada masanya, bantu pelajar meningkatkan kreativiti dan kesan pembelajaran mereka, dengan itu meningkatkan kecekapan kerja dan inovasi.
- Bantuan penyelidikan dan penulisan: Membuat cadangan topik, menganalisis kemahiran menulis dan menyediakan semakan tatabahasa dan ejaan Pada masa yang sama, ia juga boleh menyediakan sumber rujukan yang berkaitan untuk membantu pelajar menyelesaikan tugasan penyelidikan dengan lebih cepat dan tepat.
- Bantuan pembelajaran dan terjemahan bahasa: Bantu pelajar dengan terjemahan bahasa dan memahami tatabahasa dan struktur bahasa Pada masa yang sama, ia boleh menyediakan kursus pembelajaran yang diperibadikan mengikut kelajuan pembelajaran pelajar untuk menggalakkan pembelajaran dan penguasaan bahasa .
Bagaimanapun, model GPT juga menghadapi beberapa cabaran dalam bidang pendidikan. Pertama, walaupun model GPT cemerlang dalam menjana maklumat, ia juga boleh mewujudkan kebergantungan dalam diri pelajar yang memberi kesan kepada pemikiran kritis dan kebolehan menyelesaikan masalah mereka. Kedua, keselamatan data pelajar dan perlindungan privasi juga merupakan isu yang sangat penting. Selain itu, untuk memastikan ketepatan maklumat yang diberikan, model perlu dikemas kini dan diselenggara secara berterusan.
Penjagaan Perubatan
Dengan pengenalan teknologi moden, penjagaan perubatan lebih cekap, mudah dan diperibadikan, serta boleh membawa kesan rawatan yang lebih baik dan perkhidmatan perubatan keseluruhan kepada pesakit.
- R&D Ubat: Menggunakan pangkalan data ubat yang besar untuk analisis boleh membantu menemui ubat baharu dan menguji keberkesanan serta ketoksikannya, dengan itu memendekkan kitaran pembangunan dan mengurangkan kadar kegagalan.
- Diagnosis: Menggunakan data pesakit untuk analisis boleh menyediakan penjagaan pesakit yang berkesan dan meningkatkan hasil penjagaan, dan berfungsi sebagai bantuan diagnostik untuk pakar perubatan. Teknologi ini membantu meningkatkan ketepatan dan kelajuan diagnosis, dan juga boleh menjimatkan sumber perubatan dan kos masa.
- Ramalan penyakit: Dengan menganalisis sejumlah besar data perubatan untuk ramalan, ia boleh membantu doktor menjalankan pengesanan awal dan rawatan pencegahan, seterusnya meningkatkan kesan rawatan dan mengurangkan kos rawatan.
- Perubatan yang diperibadikan: Mengenal pasti corak pembolehubah dalam data individu boleh memilih ubat yang diperibadikan untuk pesakit, meningkatkan tahap pemperibadian rawatan dan meningkatkan keberkesanan rawatan.
Walau bagaimanapun, penggunaan model GPT dalam bidang penjagaan kesihatan menghadapi cabaran hanyutan data, ketelusan, risiko keselamatan dan pengesahan klinikal. Oleh itu, adalah penting untuk menilai manfaat dan risiko model GPT dalam penjagaan kesihatan dan untuk terus memantau pembangunan dan pelaksanaannya.
Perniagaan
Penggunaan alatan baharu, sumber dan susunan tenaga kerja di tempat kerja dan industri yang berubah dengan pantas meningkatkan kecekapan dan produktiviti perniagaan. Pendigitalan membawa lebih fleksibiliti, keberkesanan dan pemacu nilai kepada setiap industri dan sektor. Langkah utama dalam proses ini yang boleh disertai oleh model GPT termasuk:
- Alat Kemampanan: Bantu perniagaan menilai sejauh mana mereka mencapai matlamat kemampanan mereka dan meningkatkan tahap produktiviti dan perkhidmatan pelanggan mereka.
- Kemas kini proses pengeluaran: meningkatkan kecekapan dan membantu pengguna membuat keputusan tentang penggunaan sumber, mencapai daya saing korporat dan perlindungan alam sekitar.
- Dalam industri seperti perkhidmatan katering, hotel dan fesyen, model GPT boleh digunakan untuk perkhidmatan pelanggan, pengesyoran diperibadikan dan maklumat alam sekitar.
Walau bagaimanapun, membangunkan strategi jangka panjang dan dasar awam merupakan isu yang perlu dihadapi oleh syarikat, yang akan menggalakkan penggunaan kaedah pengeluaran mampan dan menyelesaikan cabaran teknikal seperti kebolehtafsiran model dan pengumpulan data . Pada masa hadapan, model GPT akan terus memacu cara produk teknologi beroperasi, mencipta kategori produk dan perkhidmatan baharu serta menyusun semula keseluruhan sektor perniagaan. Pada masa yang sama, kita juga perlu mendalami isu moral dan etikanya.
Pertanian
Pertanian tradisional bergantung pada pengetahuan tradisional, jentera lama dan baja organik, manakala pertanian moden bergantung pada mesin dan peralatan yang berteknologi maju. Disebabkan kemajuan dalam teknologi, peralatan pertanian telah meningkat dari segi saiz, kelajuan dan produktiviti, membolehkan lebih banyak tanah diusahakan dengan lebih cekap. Penambahbaikan dalam teknologi juga dapat membantu petani meningkatkan hasil dalam jangka panjang.
- Data Pembuatan Keputusan: Bantu petani membuat keputusan dengan menganalisis sejumlah besar data daripada berbilang sumber data untuk meningkatkan pengeluaran dan kecekapan tanaman dan ternakan.
- Pertanian jitu: seperti penderia, pengairan pintar, dron, automasi dan teknologi satelit, yang seterusnya menggalakkan penggunaan sumber yang cekap.
- Model GPT juga boleh digunakan untuk meningkatkan hasil tanaman, memantau dan mengawal perosak dan penyakit, serta pengairan yang tepat.
Walau bagaimanapun, ketepatan dan kredibiliti model GPT bergantung pada kualiti data dan kejelasan peraturan tafsiran, jadi adalah perlu untuk memastikan bahawa data untuk latihan model adalah tinggi. kualiti dan peraturan tafsiran adalah jelas. Di samping itu, model adalah mahal dan tidak boleh menggantikan pengalaman petani dan kemahiran berfikir kritis, jadi pada masa ini terdapat banyak cabaran yang perlu diselesaikan dalam pertanian.
Perjalanan dan Pengangkutan
Teknologi GPT boleh membantu syarikat logistik dan pengangkutan lebih memahami keperluan dan kehendak pelanggan, membantu dalam penyesuaian perkhidmatan dan meningkatkan kepuasan pelanggan. Boleh memahami keperluan dan pilihan pengguna untuk memberikan cadangan yang disesuaikan untuk logistik dan prosedur penghantaran. Rancangan perjalanan juga boleh dibuat dengan memberikan butiran seperti destinasi, bajet, tempoh perjalanan, dsb.
- Menyediakan syarikat logistik dan pengangkutan dengan cerapan masa nyata untuk membantu memahami keperluan pelanggan dan menyesuaikan perkhidmatan melalui teknologi NLP untuk meningkatkan kepuasan pelanggan.
- Anda boleh menggunakan model GPT sebagai alat perancangan perjalanan untuk memberikan cadangan jadual perjalanan.
- Dengan mengautomasikan proses dan mengoptimumkan operasi, anda boleh meningkatkan kecekapan, mengurangkan kos, menjejaki maklumat kargo dalam masa nyata, meningkatkan ketepatan inventori dan mengoptimumkan laluan pengedaran dan pengurusan armada.
Walau bagaimanapun, menggunakan model GPT juga menghadapi cabaran dari segi kualiti data, privasi dan kos.
E-dagang
Beli-belah dalam talian pada peranti mudah alih menjadi semakin biasa dan syarikat e-dagang mesti menyediakan pengalaman membeli-belah yang lancar dan mudah untuk mengekalkan pelanggan. Oleh itu, dalam bidang e-dagang, cara menggunakan model GPT untuk mencipta pengalaman carian yang lebih baik untuk pelanggan telah menjadi hala tuju penyelidikan yang penting dan mencabar.
- Gunakan fungsi chatbot automatiknya untuk membantu syarikat menjawab soalan pelanggan dengan pantas dan meningkatkan pengalaman pelanggan.
- Sediakan cadangan produk dan pengalaman membeli-belah yang diperibadikan kepada pengguna berdasarkan sejarah pembelian, penyemakan imbas dan carian mereka yang lalu, sekali gus meningkatkan jualan dan kepuasan pelanggan.
- Menjana tajuk produk, penerangan, slogan dan kandungan lain secara automatik untuk membantu syarikat mempromosikan produk mereka.
- Membantu perusahaan dalam analisis data dan perancangan strategik untuk meningkatkan kecekapan membuat keputusan.
Walau bagaimanapun, masih terdapat beberapa cabaran dalam penerapan model GPT dalam bidang e-dagang, seperti kapasiti model yang terhad, kesan kualiti dan konteks data terhadap keupayaan tindak balasnya, dan penerimaan pelanggan daripada chatbot automatik Bukan kelas tinggi.
Hiburan
- Model GPT boleh membantu orang ramai mengurangkan tekanan dan mengurangkan masalah kesihatan mental dengan menyediakan kandungan hiburan.
- boleh digunakan untuk hiburan orang autistik, menyediakan puisi yang menenangkan, ayat penyembuhan psikologi dan teka-teki yang menarik, serta menggunakan teknologi suara untuk memberikan teman yang selamat untuk warga emas.
- Hiburan Interaktif: Model GPT membantu orang ramai berinteraksi dengan watak maya, boleh memberikan pengesyoran diperibadikan dan penjanaan kandungan serta boleh digunakan dalam pengiklanan dalam talian, media sosial, industri filem dan televisyen serta industri permainan.
Walau bagaimanapun, data yang dikumpul oleh model GPT mestilah seimbang, memberi perhatian kepada keselamatan, kebolehpercayaan dan ketelusan data, dan memberi perhatian untuk mengelakkan penyelewengan data dan isu plagiarisme. Pada masa yang sama, privasi pengguna dan perlindungan keselamatan harus dipertimbangkan, mengurangkan kelewatan bunyi dan meningkatkan pemahaman pertuturan manusia. Dalam hal ini, kita harus berfikiran terbuka untuk menyelidik lebih lanjut dan menyelesaikan cabaran teknikal yang berkaitan.
Gaya hidup
Model GPT boleh menyediakan pengguna dengan aspek gaya hidup yang diperibadikan seperti perancangan diet, panduan perjalanan, reka bentuk pakaian yang diperibadikan, nasihat kecantikan, cadangan resipi, nasihat masa lapang dan hiburan serta bimbingan kerjaya nasihat. Di samping itu, model itu boleh menyediakan latihan untuk menyesuaikan diri dengan perubahan budaya dan teknologi yang berbeza, serta bantuan dalam pembangunan mampan.
Walau bagaimanapun, apabila menggunakan model GPT untuk memberikan cadangan, anda perlu memberi perhatian kepada kebolehpercayaan data dan isu hak cipta untuk mengelakkan pengguna yang mengelirukan. Selain itu, pembetulan dan ujian yang kerap terhadap tingkah laku melampau diperlukan untuk memastikan pengesyoran yang diberikan oleh model tidak membawa kepada kesan negatif.
Permainan
Aplikasi model GPT dalam bidang permainan boleh meningkatkan kualiti dialog dan jalan cerita permainan, mencipta dunia permainan yang kaya dan diperibadikan serta menjana watak yang lebih realistik dan menarik, dan boleh malah digunakan untuk menjana kandungan permainan dan membangunkan bot sembang. Selain itu, model GPT juga boleh menganalisis kebolehan dan kemahiran pemain untuk melaraskan kesukaran permainan secara automatik dan menjana dialog NPC dan interaksi watak lain untuk memberikan pemain pengalaman permainan yang lebih diperibadikan.
Walau bagaimanapun, untuk menggunakan sepenuhnya model GPT dalam medan permainan, anda perlu mempunyai kuasa pengkomputeran yang berkuasa dan sejumlah besar data latihan berkualiti tinggi Anda juga perlu mengawal sama ada kandungan yang dihasilkan oleh model adalah sesuai, dan juga perlu melaraskan persekitaran permainan. Cabaran ini mesti diatasi, dan latihan data berstruktur juga diperlukan untuk menggunakan model GPT dengan lebih baik dan membantu kemajuan industri permainan.
Pemasaran
Apabila model GPT digunakan untuk pemasaran, ia boleh meningkatkan kelajuan dan kecekapan penciptaan kandungan, sekali gus menjimatkan masa dan kos buruh.
- Perusahaan boleh menggunakan model GPT untuk menjana artikel berkualiti tinggi, e-mel, siaran media sosial dan kandungan lain secara automatik, dengan itu mengekalkan konsistensi dan kualiti kandungan serta mengekalkan kestabilan imej jenama.
- Anda juga boleh mencapai kesan pelbagai alatan automasi, seperti chatbots yang menjawab soalan lazim secara automatik, yang boleh mengurangkan beban kerja perkhidmatan pelanggan dan memberikan pengalaman perkhidmatan yang lebih baik.
- Boleh menjana iklan yang diperibadikan untuk menarik perhatian bakal pelanggan dan meningkatkan keberkesanan pemasaran.
- Ramalkan gelagat pembelian masa hadapan, simpan inventori yang mencukupi untuk syarikat, dan laraskan strategi pasaran tepat pada masanya.
Walau bagaimanapun, apabila menggunakan model GPT dalam bidang pemasaran, syarikat perlu menyedari potensi cabaran. Contohnya, kekurangan kawalan boleh membawa kepada keputusan yang salah, berat sebelah data boleh membawa kepada tingkah laku diskriminasi, kekurangan ketelusan menjejaskan kebolehpercayaan model dan pertimbangan etika berkaitan dengan privasi pengguna dan keselamatan data. Di samping itu, perancangan yang betul diperlukan untuk mengenal pasti senario aplikasi terbaik dan khalayak sasaran, serta tenaga kerja mahir yang boleh memantau secara berterusan untuk memastikan hasil yang diinginkan. Mengekalkan pematuhan teknikal, undang-undang dan etika adalah kunci untuk menerima pakai model GPT, yang bukan sahaja memastikan faedah ekonomi perusahaan, tetapi juga membolehkan perusahaan memperoleh kepercayaan dan kesetiaan pelanggan.
Kewangan
Industri kewangan sentiasa menjadi peneraju dalam penerapan teknologi, dan sejak beberapa tahun kebelakangan ini telah memberi lebih tumpuan kepada meningkatkan kecekapan, mengurangkan kos dan menyediakan pengalaman pelanggan yang lebih baik. Model GPT telah menunjukkan potensi besar dalam aplikasi dalam bidang kewangan, seperti analisis sentimen, ramalan kewangan, ramalan dan pengurusan risiko, strategi dagangan dan perkhidmatan pelanggan. Tetapi pada masa yang sama, model GPT juga menghadapi beberapa cabaran dalam bidang kewangan, seperti memerlukan sejumlah besar sumber pengkomputeran, kekurangan kebolehtafsiran dan terdedah kepada serangan musuh. Oleh itu, penerapan model GPT dalam bidang kewangan bukan sahaja mempunyai potensi yang besar, tetapi juga memerlukan pertimbangan yang teliti terhadap cabaran yang berkaitan untuk memastikan penggunaannya yang berkesan dan selamat.
Ringkasan
Kelebihan model GPT:
- Balas dengan pantas pertanyaan bahasa semula jadi untuk meningkatkan kecekapan dan ketepatan kerja.
- Bantu menyepadukan berbilang aplikasi digital untuk memberikan pengguna pengalaman perkhidmatan yang lebih komprehensif.
- Cemerlang dalam bidang seperti penjanaan teks dan sistem dialog, membantu orang ramai menyelesaikan kerja mereka dengan lebih mudah.
Kelemahan:
- Dalam sesetengah kes, pengguna mungkin memerlukan bantuan manusia untuk menyelesaikan masalah yang kompleks atau sensitif.
- Memerlukan banyak sumber pengkomputeran dan memori, dan kosnya tinggi, yang mungkin mengehadkan penggunaan beberapa perusahaan baru muncul.
- Kurang emosi dan pertimbangan manusia dan boleh mengakibatkan keputusan yang salah atau tidak tepat dalam keadaan tertentu.
Walaupun apabila menggunakan model siri GPT, anda perlu memberi perhatian kepada kelebihan dan kekurangannya dan memilih mengikut situasi tertentu. Tetapi kita tidak boleh menafikan bahawa sebagai teknologi yang sangat menjanjikan, ia akan terus membangun dan berinovasi pada masa hadapan dan menerokai pelbagai bidang aplikasi yang lebih luas, yang akan membantu orang ramai bekerja dan hidup dengan lebih selesa dan cekap. Dengan kemajuan teknologi yang berterusan, kita boleh menjangkakan bahawa teknologi berkaitan GPT akan menjadi pembantu pintar yang penting untuk manusia pada masa hadapan, membawa kita gaya hidup masa depan yang lebih baik~
Atas ialah kandungan terperinci Bagaimanakah teknologi GPT yang dipilih oleh Bill Gates telah berkembang, dan kehidupan siapakah yang telah merevolusikannya?. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

AI Hentai Generator
Menjana ai hentai secara percuma.

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas



Bayangkan model kecerdasan buatan yang bukan sahaja mempunyai keupayaan untuk mengatasi pengkomputeran tradisional, tetapi juga mencapai prestasi yang lebih cekap pada kos yang lebih rendah. Ini bukan fiksyen sains, DeepSeek-V2[1], model MoE sumber terbuka paling berkuasa di dunia ada di sini. DeepSeek-V2 ialah gabungan model bahasa pakar (MoE) yang berkuasa dengan ciri-ciri latihan ekonomi dan inferens yang cekap. Ia terdiri daripada 236B parameter, 21B daripadanya digunakan untuk mengaktifkan setiap penanda. Berbanding dengan DeepSeek67B, DeepSeek-V2 mempunyai prestasi yang lebih kukuh, sambil menjimatkan 42.5% kos latihan, mengurangkan cache KV sebanyak 93.3% dan meningkatkan daya pemprosesan penjanaan maksimum kepada 5.76 kali. DeepSeek ialah sebuah syarikat yang meneroka kecerdasan buatan am

AI memang mengubah matematik. Baru-baru ini, Tao Zhexuan, yang telah mengambil perhatian terhadap isu ini, telah memajukan keluaran terbaru "Buletin Persatuan Matematik Amerika" (Buletin Persatuan Matematik Amerika). Memfokuskan pada topik "Adakah mesin akan mengubah matematik?", ramai ahli matematik menyatakan pendapat mereka Seluruh proses itu penuh dengan percikan api, tegar dan menarik. Penulis mempunyai barisan yang kuat, termasuk pemenang Fields Medal Akshay Venkatesh, ahli matematik China Zheng Lejun, saintis komputer NYU Ernest Davis dan ramai lagi sarjana terkenal dalam industri. Dunia AI telah berubah secara mendadak Anda tahu, banyak artikel ini telah dihantar setahun yang lalu.

Prestasi JAX, yang dipromosikan oleh Google, telah mengatasi Pytorch dan TensorFlow dalam ujian penanda aras baru-baru ini, menduduki tempat pertama dalam 7 penunjuk. Dan ujian tidak dilakukan pada TPU dengan prestasi JAX terbaik. Walaupun dalam kalangan pembangun, Pytorch masih lebih popular daripada Tensorflow. Tetapi pada masa hadapan, mungkin lebih banyak model besar akan dilatih dan dijalankan berdasarkan platform JAX. Model Baru-baru ini, pasukan Keras menanda aras tiga hujung belakang (TensorFlow, JAX, PyTorch) dengan pelaksanaan PyTorch asli dan Keras2 dengan TensorFlow. Pertama, mereka memilih satu set arus perdana

Boston Dynamics Atlas secara rasmi memasuki era robot elektrik! Semalam, Atlas hidraulik hanya "menangis" menarik diri daripada peringkat sejarah Hari ini, Boston Dynamics mengumumkan bahawa Atlas elektrik sedang berfungsi. Nampaknya dalam bidang robot humanoid komersial, Boston Dynamics berazam untuk bersaing dengan Tesla. Selepas video baharu itu dikeluarkan, ia telah pun ditonton oleh lebih sejuta orang dalam masa sepuluh jam sahaja. Orang lama pergi dan peranan baru muncul. Ini adalah keperluan sejarah. Tidak dinafikan bahawa tahun ini adalah tahun letupan robot humanoid. Netizen mengulas: Kemajuan robot telah menjadikan majlis pembukaan tahun ini kelihatan seperti manusia, dan tahap kebebasan adalah jauh lebih besar daripada manusia Tetapi adakah ini benar-benar bukan filem seram? Pada permulaan video, Atlas berbaring dengan tenang di atas tanah, seolah-olah terlentang. Apa yang berikut adalah rahang-jatuh

Awal bulan ini, penyelidik dari MIT dan institusi lain mencadangkan alternatif yang sangat menjanjikan kepada MLP - KAN. KAN mengatasi MLP dari segi ketepatan dan kebolehtafsiran. Dan ia boleh mengatasi prestasi MLP berjalan dengan bilangan parameter yang lebih besar dengan bilangan parameter yang sangat kecil. Sebagai contoh, penulis menyatakan bahawa mereka menggunakan KAN untuk menghasilkan semula keputusan DeepMind dengan rangkaian yang lebih kecil dan tahap automasi yang lebih tinggi. Khususnya, MLP DeepMind mempunyai kira-kira 300,000 parameter, manakala KAN hanya mempunyai kira-kira 200 parameter. KAN mempunyai asas matematik yang kukuh seperti MLP berdasarkan teorem penghampiran universal, manakala KAN berdasarkan teorem perwakilan Kolmogorov-Arnold. Seperti yang ditunjukkan dalam rajah di bawah, KAN telah

Video terbaru robot Tesla Optimus dikeluarkan, dan ia sudah boleh berfungsi di kilang. Pada kelajuan biasa, ia mengisih bateri (bateri 4680 Tesla) seperti ini: Pegawai itu juga mengeluarkan rupanya pada kelajuan 20x - pada "stesen kerja" kecil, memilih dan memilih dan memilih: Kali ini ia dikeluarkan Salah satu sorotan video itu ialah Optimus menyelesaikan kerja ini di kilang, sepenuhnya secara autonomi, tanpa campur tangan manusia sepanjang proses. Dan dari perspektif Optimus, ia juga boleh mengambil dan meletakkan bateri yang bengkok, memfokuskan pada pembetulan ralat automatik: Berkenaan tangan Optimus, saintis NVIDIA Jim Fan memberikan penilaian yang tinggi: Tangan Optimus adalah robot lima jari di dunia paling cerdik. Tangannya bukan sahaja boleh disentuh

Pengesanan objek ialah masalah yang agak matang dalam sistem pemanduan autonomi, antaranya pengesanan pejalan kaki adalah salah satu algoritma terawal untuk digunakan. Penyelidikan yang sangat komprehensif telah dijalankan dalam kebanyakan kertas kerja. Walau bagaimanapun, persepsi jarak menggunakan kamera fisheye untuk pandangan sekeliling agak kurang dikaji. Disebabkan herotan jejari yang besar, perwakilan kotak sempadan standard sukar dilaksanakan dalam kamera fisheye. Untuk mengurangkan perihalan di atas, kami meneroka kotak sempadan lanjutan, elips dan reka bentuk poligon am ke dalam perwakilan kutub/sudut dan mentakrifkan metrik mIOU pembahagian contoh untuk menganalisis perwakilan ini. Model fisheyeDetNet yang dicadangkan dengan bentuk poligon mengatasi model lain dan pada masa yang sama mencapai 49.5% mAP pada set data kamera fisheye Valeo untuk pemanduan autonomi

FP8 dan ketepatan pengiraan titik terapung yang lebih rendah bukan lagi "paten" H100! Lao Huang mahu semua orang menggunakan INT8/INT4, dan pasukan Microsoft DeepSpeed memaksa diri mereka menjalankan FP6 pada A100 tanpa sokongan rasmi daripada Nvidia. Keputusan ujian menunjukkan bahawa kaedah baharu TC-FPx FP6 kuantisasi pada A100 adalah hampir atau kadangkala lebih pantas daripada INT4, dan mempunyai ketepatan yang lebih tinggi daripada yang terakhir. Selain itu, terdapat juga sokongan model besar hujung ke hujung, yang telah bersumberkan terbuka dan disepadukan ke dalam rangka kerja inferens pembelajaran mendalam seperti DeepSpeed. Keputusan ini juga mempunyai kesan serta-merta pada mempercepatkan model besar - di bawah rangka kerja ini, menggunakan satu kad untuk menjalankan Llama, daya pemprosesan adalah 2.65 kali lebih tinggi daripada dua kad. satu
