Cara pemprosesan bahasa semula jadi (NLP) berfungsi-AI-php.cn

Jadual Kandungan

Apakah hubungan antara model bahasa dan kecerdasan buatan

Sebelum mendalami mekanisme dan fungsi ciri yang digunakan oleh model bahasa, adalah penting untuk memahami cara mereka memproses korpora teks mentah (iaitu, data tidak berstruktur yang mana model statistik dilatih). Langkah pertama dalam pemodelan bahasa ialah membaca korpus teks asas ini, atau apa yang boleh dianggap sebagai konteks bersyarat model. Komponen teras model boleh terdiri daripada sebarang kandungan dalaman, daripada karya sastera ke halaman web atau bahkan transkripsi bahasa pertuturan. Walau apa pun asal usulnya, korpus ini mewakili kekayaan dan kerumitan bahasa dalam bentuk yang paling primitif. Skop dan keluasan korpus atau set data teks yang digunakan untuk latihan mengklasifikasikan model bahasa AI sebagai model bahasa yang besar.

Terdapat banyak jenis model bahasa, masing-masing mempunyai kelebihan tersendiri dan cara pemprosesan bahasa. Kebanyakannya adalah berdasarkan konsep taburan kebarangkalian.

Model bahasa statistik (model N-Gram)

Model bahasa berasaskan rangkaian saraf

Recurrent Neural Network (RNN)

Model berdasarkan seni bina Transformer

Model bahasa BERT Google

LaMDA Google

Model Bahasa: Had Semasa dan Trend Masa Depan

Masa Depan Model Bahasa

Impak model bahasa pada pusat data

Rumah

Peranti teknologi

Cara pemprosesan bahasa semula jadi (NLP) berfungsi

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Apr 24, 2024 pm 04:31 PM

AI nlp model bahasa

Cara pemprosesan bahasa semula jadi (NLP) berfungsi

Artikel ini telah pun mendedahkan misteri model bahasa dan menjelaskan konsep dan mekanisme asasnya untuk memproses data teks mentah. Ia merangkumi beberapa jenis model bahasa dan model bahasa besar, memfokuskan pada model berasaskan rangkaian saraf.

Definisi Model Bahasa

Model bahasa memfokuskan pada keupayaan untuk menjana teks seperti manusia. Model bahasa am pada asasnya ialah model statistik atau taburan kebarangkalian bagi urutan perkataan yang menerangkan kemungkinan sesuatu perkataan muncul dalam setiap urutan. Ini membantu meramalkan perkataan atau perkataan seterusnya berdasarkan perkataan sebelumnya dalam ayat.

Model bahasa probabilistik yang dipermudah boleh digunakan dalam pelbagai aplikasi seperti terjemahan mesin, pembetulan ralat automatik, pengecaman pertuturan dan autolengkap untuk mengisi perkataan berikut atau mencadangkan urutan perkataan yang mungkin untuk pengguna.

Model jenis ini telah berkembang menjadi model yang lebih maju, termasuk model pengubah, yang boleh meramal dengan lebih tepat dengan mempertimbangkan perkataan dan konteks sekeliling di seluruh teks, dan bukannya hanya memfokuskan pada perkataan sebelumnya atau perkataan sebelumnya dalam urutan Perkataan seterusnya.

Apakah hubungan antara model bahasa dan kecerdasan buatan

Pemprosesan bahasa semulajadi (NLP) ialah subdisiplin penting yang berkait rapat dengan model bahasa, sains komputer dan kecerdasan buatan (AI). Matlamat utama kecerdasan buatan adalah untuk mensimulasikan kecerdasan manusia. Bahasa adalah ciri yang menentukan kognisi manusia dan penting untuk usaha ini. Asas pemprosesan bahasa semula jadi ialah pemodelan bahasa dan sains komputer. Model bahasa ialah kaedah memodelkan fenomena bahasa semula jadi Ia merealisasikan pemahaman dan penjanaan teks dengan menganalisis struktur dan peraturan bahasa. Sains komputer menyediakan alat dan teknik untuk mencapai matlamat ini. Melalui pemprosesan bahasa semula jadi, banyak aplikasi boleh direalisasikan, seperti terjemahan mesin, pengecaman pertuturan, analisis sentimen, klasifikasi teks, dll. Teknologi ini membolehkan komputer membina model bahasa yang baik yang memahami dan menjana teks seperti manusia dan melaksanakan pembelajaran mesin, di mana mesin memahami hubungan kontekstual, emosi dan semantik antara perkataan, termasuk peraturan tatabahasa dan bahagian pertuturan, serta meniru manusia. -seperti teks.

Keupayaan pembelajaran mesin ini merupakan langkah penting ke arah kecerdasan buatan sebenar, memudahkan interaksi manusia-mesin dalam bahasa semula jadi dan membolehkan mesin melaksanakan tugas NLP yang kompleks yang melibatkan pemahaman dan penjanaan bahasa manusia. Ini termasuk tugas pemprosesan bahasa semula jadi moden seperti terjemahan, pengecaman pertuturan dan analisis sentimen.

Membaca Raw Text Corpus

Sebelum mendalami mekanisme dan fungsi ciri yang digunakan oleh model bahasa, adalah penting untuk memahami cara mereka memproses korpora teks mentah (iaitu, data tidak berstruktur yang mana model statistik dilatih). Langkah pertama dalam pemodelan bahasa ialah membaca korpus teks asas ini, atau apa yang boleh dianggap sebagai konteks bersyarat model. Komponen teras model boleh terdiri daripada sebarang kandungan dalaman, daripada karya sastera ke halaman web atau bahkan transkripsi bahasa pertuturan. Walau apa pun asal usulnya, korpus ini mewakili kekayaan dan kerumitan bahasa dalam bentuk yang paling primitif. Skop dan keluasan korpus atau set data teks yang digunakan untuk latihan mengklasifikasikan model bahasa AI sebagai model bahasa yang besar.

Model bahasa belajar dengan membaca istilah, konteks atau pangkalan data teks perkataan demi perkataan, menangkap struktur dan corak asas yang kompleks dalam bahasa. Ia melakukan ini dengan mengekodkan perkataan ke dalam vektor berangka - satu proses yang dipanggil pembenaman perkataan. Vektor ini mempunyai makna dan sifat sintaksis yang mewakili perkataan. Sebagai contoh, perkataan yang digunakan dalam konteks yang serupa cenderung mempunyai vektor yang serupa. Proses model yang menukar perkataan kepada vektor adalah penting kerana ia membenarkan model bahasa beroperasi dalam format matematik. Ramalkan pautan urutan perkataan dan dayakan proses yang lebih maju seperti terjemahan dan analisis sentimen.

Selepas membaca dan mengekod korpus teks mentah, model bahasa boleh menjana teks seperti manusia atau urutan perkataan yang diramalkan. Mekanisme yang digunakan oleh tugas NLP ini berbeza dari model ke model. Walau bagaimanapun, mereka semua berkongsi matlamat asas untuk mentafsir kebarangkalian urutan tertentu yang berlaku dalam kehidupan sebenar. Ini dibincangkan lebih lanjut dalam bahagian seterusnya.

Fahami jenis model bahasa

Terdapat banyak jenis model bahasa, masing-masing mempunyai kelebihan tersendiri dan cara pemprosesan bahasa. Kebanyakannya adalah berdasarkan konsep taburan kebarangkalian.

Model bahasa statistik, dalam bentuk paling asasnya, bergantung pada kekerapan urutan perkataan dalam data teks untuk meramalkan perkataan masa hadapan berdasarkan perkataan sebelumnya.

Sebaliknya, model bahasa saraf menggunakan rangkaian saraf untuk meramal perkataan seterusnya dalam ayat, dengan mengambil kira konteks yang lebih besar dan lebih banyak data teks untuk ramalan yang lebih tepat. Sesetengah model bahasa saraf melakukan kerja yang lebih baik daripada yang lain pada taburan kebarangkalian dengan menilai dan memahami konteks penuh ayat.

Model berasaskan transformer seperti BERT dan GPT-2 telah mendapat kemasyhuran kerana keupayaan mereka untuk mempertimbangkan konteks perkataan semasa membuat ramalan. Seni bina model Transformer yang menjadi asas model ini membolehkan mereka mencapai hasil yang optimum pada pelbagai tugas, menunjukkan kuasa model bahasa moden.

Model kemungkinan pertanyaan ialah model bahasa lain yang berkaitan dengan pencarian maklumat. Model kemungkinan pertanyaan menentukan perkaitan dokumen khusus untuk menjawab pertanyaan tertentu.

Model bahasa statistik (model N-Gram)

Model bahasa N-gram ialah salah satu kaedah asas pemprosesan bahasa semula jadi. "N" dalam N-gram mewakili bilangan perkataan yang dipertimbangkan dalam model pada satu masa, dan ia mewakili kemajuan berbanding model unari berdasarkan satu perkataan yang boleh membuat ramalan secara bebas daripada mana-mana perkataan lain. "N" dalam N-gram mewakili bilangan perkataan yang dipertimbangkan dalam model pada satu masa. Model bahasa N-gram meramalkan kejadian sesuatu perkataan berdasarkan (N-1) perkataan sebelumnya. Sebagai contoh, dalam model binari (N sama dengan 2), ramalan sesuatu perkataan akan bergantung pada perkataan sebelumnya. Dalam kes model ternary (N sama dengan 3), ramalan akan bergantung pada dua perkataan terakhir.

Model N-gram beroperasi berdasarkan sifat statistik. Mereka mengira kebarangkalian bahawa perkataan tertentu muncul selepas urutan perkataan berdasarkan kekerapan kejadiannya dalam korpus latihan. Sebagai contoh, dalam model binari, frasa "Iam" akan menjadikan perkataan "going" lebih cenderung untuk diikuti daripada perkataan "anapple" kerana "Iamgoing" adalah lebih biasa dalam bahasa Inggeris daripada "Iamanapple."

Walaupun model N-gram adalah mudah dan cekap dari segi pengiraan, ia juga mempunyai had. Mereka mengalami apa yang dipanggil "kutukan dimensi", di mana taburan kebarangkalian menjadi jarang apabila nilai N meningkat. Mereka juga tidak mempunyai keupayaan untuk menangkap kebergantungan atau konteks jangka panjang dalam ayat, kerana mereka hanya boleh mempertimbangkan (N-1) perkataan sebelumnya.

Walaupun begitu, model N-gram masih relevan hari ini dan telah digunakan dalam banyak aplikasi seperti pengecaman pertuturan, sistem autolengkap, input teks ramalan untuk telefon mudah alih dan juga untuk memproses pertanyaan carian. Mereka adalah tulang belakang pemodelan bahasa moden dan terus memacu perkembangan pemodelan bahasa.

Model bahasa berasaskan rangkaian saraf

Model bahasa berasaskan rangkaian saraf dianggap sebagai model eksponen dan mewakili lonjakan besar ke hadapan dalam pemodelan bahasa. Tidak seperti model n-gram, mereka memanfaatkan kuasa ramalan rangkaian saraf untuk mensimulasikan struktur bahasa kompleks yang tidak dapat ditangkap oleh model tradisional. Sesetengah model boleh mengingati input sebelumnya dalam lapisan tersembunyi dan menggunakan memori ini untuk mempengaruhi output dan meramalkan perkataan atau perkataan seterusnya dengan lebih tepat.

Recurrent Neural Network (RNN)

RNN direka untuk memproses data berjujukan dengan menyepadukan "memori" input masa lalu. Pada asasnya, RNN menghantar maklumat dari satu langkah dalam urutan ke seterusnya, membolehkan mereka mengenali corak dari semasa ke semasa untuk membantu meramalkan perkataan seterusnya dengan lebih baik. Ini menjadikan ia amat berkesan untuk tugas yang susunan unsur adalah penting, seperti halnya dengan bahasa.

Walau bagaimanapun, kaedah pemodelan bahasa bukan tanpa batasan. Apabila urutan terlalu panjang, RNN cenderung kehilangan keupayaan untuk menyambung maklumat, masalah yang dikenali sebagai masalah kecerunan yang lenyap. Varian model khusus yang dipanggil ingatan jangka pendek panjang (LSTM) telah diperkenalkan untuk membantu mengekalkan kebergantungan jangka panjang dalam data bahasa. Unit Berulang Berpagar (GRU) mewakili satu lagi varian model yang lebih khusus.

RNN masih digunakan secara meluas hari ini, terutamanya kerana ia mudah dan berkesan dalam tugas tertentu. Walau bagaimanapun, ia secara beransur-ansur digantikan oleh model yang lebih maju seperti Transformers dengan prestasi unggul. Walaupun begitu, RNN kekal sebagai asas pemodelan bahasa dan asas bagi kebanyakan rangkaian neural semasa dan seni bina berasaskan model Transformer.

Model berdasarkan seni bina Transformer

Transformer mewakili kemajuan terkini dalam model bahasa dan bertujuan untuk mengatasi batasan RNN. Tidak seperti RNN yang memproses jujukan secara berperingkat, Transformers memproses semua elemen jujukan secara serentak, menghapuskan keperluan untuk pengiraan kitaran penjajaran jujukan. Pendekatan pemprosesan selari ini, unik kepada seni bina Transformer, membolehkan model memproses jujukan yang lebih panjang dan memanfaatkan julat konteks yang lebih luas dalam ramalan, memberikannya kelebihan dalam tugas seperti terjemahan mesin dan ringkasan teks.

Inti Transformer ialah mekanisme perhatian, yang memberikan pemberat yang berbeza kepada pelbagai bahagian jujukan, membolehkan model memfokus lebih pada elemen yang berkaitan dan kurang pada elemen yang tidak berkaitan. Ciri ini menjadikan Transformer sangat baik dalam memahami konteks, aspek utama bahasa manusia yang telah menjadi cabaran besar untuk model awal.

Model bahasa BERT Google

BERT ialah singkatan daripada Transformers Dwidirectional Encoder Representation dan merupakan model bahasa mengganggu yang dibangunkan oleh Google. Tidak seperti model tradisional yang memproses perkataan unik dalam ayat secara berurutan, model dwiarah menganalisis teks dengan membaca keseluruhan urutan perkataan secara serentak. Pendekatan unik ini membolehkan model dwiarah mempelajari konteks perkataan berdasarkan persekitarannya (sisi kiri dan kanan).

Reka bentuk ini membolehkan model dwiarah seperti BERT memahami konteks perkataan dan ayat yang lengkap untuk memahami dan mentafsir bahasa dengan lebih tepat. Walau bagaimanapun, kelemahan BERT ialah ia adalah intensif dari segi pengiraan, memerlukan perkakasan dan kod perisian mewah serta masa latihan yang lebih lama. Namun begitu, kelebihan prestasinya dalam tugas NLP seperti menjawab soalan dan penaakulan lisan menetapkan standard baharu untuk pemprosesan bahasa semula jadi.

LaMDA Google

LaMDA bermaksud "Model Bahasa untuk Aplikasi Perbualan" dan merupakan satu lagi model bahasa inovatif yang dibangunkan oleh Google. LaMDA membawa AI perbualan ke peringkat seterusnya, menjana keseluruhan perbualan dengan hanya satu gesaan.

Ia melakukan ini dengan memanfaatkan mekanisme perhatian dan beberapa teknik pemahaman bahasa semula jadi yang paling maju. Ini membolehkan LaMDA, sebagai contoh, untuk lebih memahami peraturan tatabahasa dan bahagian pertuturan, dan menangkap nuansa dalam perbualan manusia seperti jenaka, sindiran dan konteks emosi, membolehkan ia menjalankan perbualan seperti manusia.

LaMDA masih dalam peringkat awal pembangunan, tetapi ia berpotensi untuk merevolusikan AI perbualan dan benar-benar merapatkan jurang antara manusia dan mesin.

Model Bahasa: Had Semasa dan Trend Masa Depan

Walaupun model bahasa berkuasa, model bahasa itu masih mempunyai had yang ketara. Masalah utama ialah kekurangan pemahaman tentang konteks sebenar perkataan unik. Walaupun model ini boleh menjana teks yang berkaitan kontekstual, mereka tidak dapat memahami kandungan yang mereka hasilkan, yang merupakan perbezaan yang ketara daripada pemprosesan bahasa manusia.

Cabaran lain ialah berat sebelah yang wujud dalam data yang digunakan untuk melatih model ini. Oleh kerana data latihan sering mengandungi berat sebelah manusia, model secara tidak sengaja boleh mengekalkan berat sebelah ini, yang membawa kepada keputusan yang herot atau tidak adil. Model bahasa yang berkuasa juga menimbulkan persoalan etika, kerana ia mungkin digunakan untuk menjana maklumat yang mengelirukan atau kandungan palsu.

Masa Depan Model Bahasa

Melangkah ke hadapan, menangani had dan isu etika ini akan menjadi bahagian penting dalam membangunkan model bahasa dan tugasan NLP. Penyelidikan dan inovasi berterusan diperlukan untuk meningkatkan pemahaman dan keadilan model bahasa sambil meminimumkan potensi penyalahgunaannya.

Dengan mengandaikan langkah kritikal ini akan diutamakan oleh penganjur dalam bidang tersebut, masa depan model bahasa adalah cerah dan mempunyai potensi yang tidak terhad. Dengan kemajuan dalam pembelajaran mendalam dan pembelajaran pemindahan, model bahasa semakin baik dalam memahami dan menjana teks seperti manusia, menyelesaikan tugas NLP dan memahami bahasa yang berbeza. Transformer seperti BERT dan GPT-3 berada di barisan hadapan dalam perkembangan ini, menolak had pemodelan bahasa dan aplikasi penjanaan pertuturan dan membantu bidang meneroka sempadan baharu, termasuk pembelajaran mesin yang lebih kompleks dan aplikasi lanjutan seperti pengecaman tulisan tangan.

Namun, kemajuan juga membawa cabaran baharu. Apabila model bahasa menjadi semakin kompleks dan intensif data, permintaan untuk sumber pengkomputeran terus meningkat, yang menimbulkan persoalan tentang kecekapan dan kebolehcapaian. Semasa kami bergerak ke hadapan, matlamat kami adalah untuk memanfaatkan alatan berkuasa ini secara bertanggungjawab untuk menambah keupayaan manusia dan mencipta sistem AI yang lebih pintar, lebih bernuansa dan lebih empati.

Evolusi model bahasa penuh dengan kemajuan dan cabaran utama. Daripada pengenalan RNN, model bahasa yang merevolusikan cara teknologi memahami data jujukan, kepada kemunculan model yang mengubah permainan seperti BERT dan LaMDA, bidang ini telah mencapai kemajuan yang luar biasa.

Kemajuan ini membolehkan pemahaman bahasa yang lebih mendalam dan lebih bernuansa, menetapkan standard baharu dalam bidang tersebut. Laluan ke hadapan memerlukan penyelidikan, inovasi dan peraturan yang berterusan untuk memastikan alat berkuasa ini boleh mencapai potensi penuh mereka tanpa menjejaskan ekuiti dan etika.

Impak model bahasa pada pusat data

Melatih dan menjalankan model bahasa memerlukan kuasa pengkomputeran yang berkuasa, jadi teknologi ini termasuk dalam kategori pengkomputeran berprestasi tinggi. Untuk memenuhi permintaan ini, pusat data perlu mengoptimumkan infrastruktur dan penyelesaian kalis masa hadapan yang mengimbangi kesan alam sekitar daripada penggunaan tenaga yang diperlukan untuk membekalkan kuasa dan menyejukkan peralatan pemprosesan data supaya model bahasa boleh berjalan dengan pasti dan tanpa gangguan.

Impak ini bukan sahaja kritikal untuk pusat data teras, tetapi juga akan memberi kesan kepada pertumbuhan berterusan pengkomputeran awan dan tepi. Banyak organisasi akan menggunakan perkakasan dan perisian khusus di premis untuk menyokong kefungsian model bahasa. Organisasi lain ingin mendekatkan kuasa pengkomputeran kepada pengguna akhir untuk meningkatkan pengalaman yang boleh diberikan oleh model bahasa.

Dalam mana-mana kes, organisasi dan pengendali pusat data perlu membuat pilihan infrastruktur yang mengimbangi keperluan teknologi dengan keperluan untuk mengendalikan kemudahan yang cekap dan kos efektif.

Atas ialah kandungan terperinci Cara pemprosesan bahasa semula jadi (NLP) berfungsi. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang lalu By DDD

Akan R.E.P.O. Ada Crossplay?

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7561

Tutorial CakePHP

1384

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Bytedance Cutting melancarkan keahlian super SVIP: 499 yuan untuk langganan tahunan berterusan, menyediakan pelbagai fungsi AI Jun 28, 2024 am 03:51 AM

Laman web ini melaporkan pada 27 Jun bahawa Jianying ialah perisian penyuntingan video yang dibangunkan oleh FaceMeng Technology, anak syarikat ByteDance Ia bergantung pada platform Douyin dan pada asasnya menghasilkan kandungan video pendek untuk pengguna platform tersebut Windows , MacOS dan sistem pengendalian lain. Jianying secara rasmi mengumumkan peningkatan sistem keahliannya dan melancarkan SVIP baharu, yang merangkumi pelbagai teknologi hitam AI, seperti terjemahan pintar, penonjolan pintar, pembungkusan pintar, sintesis manusia digital, dsb. Dari segi harga, yuran bulanan untuk keratan SVIP ialah 79 yuan, yuran tahunan ialah 599 yuan (nota di laman web ini: bersamaan dengan 49.9 yuan sebulan), langganan bulanan berterusan ialah 59 yuan sebulan, dan langganan tahunan berterusan ialah 499 yuan setahun (bersamaan dengan 41.6 yuan sebulan) . Di samping itu, pegawai yang dipotong juga menyatakan bahawa untuk meningkatkan pengalaman pengguna, mereka yang telah melanggan VIP asal

Pembantu pengekodan AI yang ditambah konteks menggunakan Rag dan Sem-Rag Jun 10, 2024 am 11:08 AM

Tingkatkan produktiviti, kecekapan dan ketepatan pembangun dengan menggabungkan penjanaan dipertingkatkan semula dan memori semantik ke dalam pembantu pengekodan AI. Diterjemah daripada EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG, pengarang JanakiramMSV. Walaupun pembantu pengaturcaraan AI asas secara semulajadi membantu, mereka sering gagal memberikan cadangan kod yang paling relevan dan betul kerana mereka bergantung pada pemahaman umum bahasa perisian dan corak penulisan perisian yang paling biasa. Kod yang dijana oleh pembantu pengekodan ini sesuai untuk menyelesaikan masalah yang mereka bertanggungjawab untuk menyelesaikannya, tetapi selalunya tidak mematuhi piawaian pengekodan, konvensyen dan gaya pasukan individu. Ini selalunya menghasilkan cadangan yang perlu diubah suai atau diperhalusi agar kod itu diterima ke dalam aplikasi

Bolehkah penalaan halus benar-benar membolehkan LLM mempelajari perkara baharu: memperkenalkan pengetahuan baharu boleh menjadikan model menghasilkan lebih banyak halusinasi Jun 11, 2024 pm 03:57 PM

Model Bahasa Besar (LLM) dilatih pada pangkalan data teks yang besar, di mana mereka memperoleh sejumlah besar pengetahuan dunia sebenar. Pengetahuan ini dibenamkan ke dalam parameter mereka dan kemudiannya boleh digunakan apabila diperlukan. Pengetahuan tentang model ini "diperbaharui" pada akhir latihan. Pada akhir pra-latihan, model sebenarnya berhenti belajar. Selaraskan atau perhalusi model untuk mempelajari cara memanfaatkan pengetahuan ini dan bertindak balas dengan lebih semula jadi kepada soalan pengguna. Tetapi kadangkala pengetahuan model tidak mencukupi, dan walaupun model boleh mengakses kandungan luaran melalui RAG, ia dianggap berfaedah untuk menyesuaikan model kepada domain baharu melalui penalaan halus. Penalaan halus ini dilakukan menggunakan input daripada anotasi manusia atau ciptaan LLM lain, di mana model menemui pengetahuan dunia sebenar tambahan dan menyepadukannya

Tujuh Soalan Temuduga Teknikal GenAI & LLM yang Cool Jun 07, 2024 am 10:06 AM

Untuk mengetahui lebih lanjut tentang AIGC, sila layari: 51CTOAI.x Komuniti https://www.51cto.com/aigc/Translator|Jingyan Reviewer|Chonglou berbeza daripada bank soalan tradisional yang boleh dilihat di mana-mana sahaja di Internet memerlukan pemikiran di luar kotak. Model Bahasa Besar (LLM) semakin penting dalam bidang sains data, kecerdasan buatan generatif (GenAI) dan kecerdasan buatan. Algoritma kompleks ini meningkatkan kemahiran manusia dan memacu kecekapan dan inovasi dalam banyak industri, menjadi kunci kepada syarikat untuk kekal berdaya saing. LLM mempunyai pelbagai aplikasi Ia boleh digunakan dalam bidang seperti pemprosesan bahasa semula jadi, penjanaan teks, pengecaman pertuturan dan sistem pengesyoran. Dengan belajar daripada sejumlah besar data, LLM dapat menjana teks

Lima sekolah pembelajaran mesin yang anda tidak tahu Jun 05, 2024 pm 08:51 PM

Pembelajaran mesin ialah cabang penting kecerdasan buatan yang memberikan komputer keupayaan untuk belajar daripada data dan meningkatkan keupayaan mereka tanpa diprogramkan secara eksplisit. Pembelajaran mesin mempunyai pelbagai aplikasi dalam pelbagai bidang, daripada pengecaman imej dan pemprosesan bahasa semula jadi kepada sistem pengesyoran dan pengesanan penipuan, dan ia mengubah cara hidup kita. Terdapat banyak kaedah dan teori yang berbeza dalam bidang pembelajaran mesin, antaranya lima kaedah yang paling berpengaruh dipanggil "Lima Sekolah Pembelajaran Mesin". Lima sekolah utama ialah sekolah simbolik, sekolah sambungan, sekolah evolusi, sekolah Bayesian dan sekolah analogi. 1. Simbolisme, juga dikenali sebagai simbolisme, menekankan penggunaan simbol untuk penaakulan logik dan ekspresi pengetahuan. Aliran pemikiran ini percaya bahawa pembelajaran adalah proses penolakan terbalik, melalui sedia ada

Untuk menyediakan tanda aras dan sistem penilaian menjawab soalan saintifik dan kompleks baharu untuk model besar, UNSW, Argonne, University of Chicago dan institusi lain bersama-sama melancarkan rangka kerja SciQAG Jul 25, 2024 am 06:42 AM

Editor |ScienceAI Question Answering (QA) set data memainkan peranan penting dalam mempromosikan penyelidikan pemprosesan bahasa semula jadi (NLP). Set data QA berkualiti tinggi bukan sahaja boleh digunakan untuk memperhalusi model, tetapi juga menilai dengan berkesan keupayaan model bahasa besar (LLM), terutamanya keupayaan untuk memahami dan menaakul tentang pengetahuan saintifik. Walaupun pada masa ini terdapat banyak set data QA saintifik yang meliputi bidang perubatan, kimia, biologi dan bidang lain, set data ini masih mempunyai beberapa kekurangan. Pertama, borang data adalah agak mudah, kebanyakannya adalah soalan aneka pilihan. Ia mudah dinilai, tetapi mengehadkan julat pemilihan jawapan model dan tidak dapat menguji sepenuhnya keupayaan model untuk menjawab soalan saintifik. Sebaliknya, Soal Jawab terbuka

Prestasi SOTA, kaedah AI ramalan pertalian protein-ligan pelbagai mod Xiamen, menggabungkan maklumat permukaan molekul buat kali pertama Jul 17, 2024 pm 06:37 PM

Editor |. KX Dalam bidang penyelidikan dan pembangunan ubat, meramalkan pertalian pengikatan protein dan ligan dengan tepat dan berkesan adalah penting untuk pemeriksaan dan pengoptimuman ubat. Walau bagaimanapun, kajian semasa tidak mengambil kira peranan penting maklumat permukaan molekul dalam interaksi protein-ligan. Berdasarkan ini, penyelidik dari Universiti Xiamen mencadangkan rangka kerja pengekstrakan ciri berbilang mod (MFE) novel, yang buat pertama kalinya menggabungkan maklumat mengenai permukaan protein, struktur dan jujukan 3D, dan menggunakan mekanisme perhatian silang untuk membandingkan ciri modaliti yang berbeza penjajaran. Keputusan eksperimen menunjukkan bahawa kaedah ini mencapai prestasi terkini dalam meramalkan pertalian mengikat protein-ligan. Tambahan pula, kajian ablasi menunjukkan keberkesanan dan keperluan maklumat permukaan protein dan penjajaran ciri multimodal dalam rangka kerja ini. Penyelidikan berkaitan bermula dengan "S

SK Hynix akan memaparkan produk berkaitan AI baharu pada 6 Ogos: HBM3E 12 lapisan, NAND 321 tinggi, dsb. Aug 01, 2024 pm 09:40 PM

Menurut berita dari laman web ini pada 1 Ogos, SK Hynix mengeluarkan catatan blog hari ini (1 Ogos), mengumumkan bahawa ia akan menghadiri Global Semiconductor Memory Summit FMS2024 yang akan diadakan di Santa Clara, California, Amerika Syarikat dari 6 hingga 8 Ogos, mempamerkan banyak produk penjanaan teknologi baru. Pengenalan kepada Sidang Kemuncak Memori dan Penyimpanan Masa Depan (FutureMemoryandStorage), dahulunya Sidang Kemuncak Memori Flash (FlashMemorySummit) terutamanya untuk pembekal NAND, dalam konteks peningkatan perhatian kepada teknologi kecerdasan buatan, tahun ini dinamakan semula sebagai Sidang Kemuncak Memori dan Penyimpanan Masa Depan (FutureMemoryandStorage) kepada jemput vendor DRAM dan storan serta ramai lagi pemain. Produk baharu SK hynix dilancarkan tahun lepas

See all articles