OpenAI, syarikat yang membangunkan ChatGPT, menunjukkan kajian kes yang dijalankan oleh Morgan Stanley di tapak webnya. Topiknya ialah "Morgan Stanley Wealth Management menggunakan GPT-4 untuk mengatur pangkalan pengetahuannya yang luas." Kajian kes itu memetik Jeff McMillan, ketua analisis, data dan inovasi di Morgan Stanley, dengan berkata, "Model ini akan menyediakan dalaman yang dikuasakan oleh a. chatbot yang akan menjalankan carian komprehensif kandungan pengurusan kekayaan dan dengan berkesan membuka kunci pengetahuan terkumpul Morgan Stanley Wealth Management.”
McMillan seterusnya menekankan: "Dengan GPT-4, anda pada asasnya serta-merta mempunyai pengetahuan tentang orang yang paling berpengetahuan dalam pengurusan kekayaan... Anggaplah ia sebagai ketua strategi pelaburan kami, ketua strategi ekonomi global, ahli strategi ekuiti global , dan setiap penganalisis lain di dunia, dan sentiasa bersedia setiap hari, kami percaya ini adalah keupayaan transformatif untuk syarikat kami.”
Ini ialah pengurusan pengetahuan - keupayaan untuk menjelmakan pengetahuan organisasi dan kepakaran dalam sistem, proses dan alatan yang berinteraksi dengan pelanggan.
Jadi adakah matlamat ini benar-benar tercapai? Adakah AI generatif adalah jawapan kepada akses pengetahuan, perolehan dan aplikasi Sebelum mengisytiharkan kemenangan atas kekacauan maklumat, adalah penting untuk mempertimbangkan beberapa elemen dan pertimbangan asas?
Pertama, asas persepsi bahawa AI generatif boleh mengatasi cabaran pengurusan pengetahuan ialah andaian bahawa pengetahuan wujud dalam bentuk yang jelas dan didokumenkan. Walau bagaimanapun, dalam kebanyakan perusahaan, pengetahuan dikunci dalam kepala pekerja, dan jika disimpan dalam bentuk digital, ia tersebar dalam silo dalam ekosistem jabatan, teknologi dan repositori. OpenAI selanjutnya menyatakan di laman webnya bahawa Morgan Stanley menerbitkan beribu-ribu kertas setiap tahun yang meliputi pasaran modal, kelas aset, analisis industri dan wilayah ekonomi global...Kekayaan pengetahuan ini mencipta perpustakaan kandungan dalaman yang unik yang boleh diproses dan dihuraikan menggunakan GPT -4, serta dikawal secara dalaman. Morgan Stanley mempunyai pengetahuan yang boleh menjadi asas untuk menggunakan model bahasa berskala besar ChatGPT. Jika kandungan perusahaan dan sumber pengetahuan tidak boleh diakses, tidak berkualiti atau tidak konsisten dengan keperluan pelanggan dan pekerja, ChatGPT tidak akan mempunyai akses kepada pengetahuan khusus yang bertindak balas kepada keperluan tersebut.
Kedua, kecerdasan buatan generatif mencipta kandungan. Ia bukan mekanisme mendapatkan semula. Jadi bagaimana asas pengetahuan asal digunakan. Ini adalah kawasan yang rumit. ChatGPT sedang mencari corak dalam hubungan kandungan dan konsep supaya ia boleh meramalkan teks yang harus dipaparkan berdasarkan gesaan. Gesaan ialah isyarat, sama seperti istilah carian ialah isyarat. Enjin carian meramalkan maklumat yang perlu dipaparkan bukan sahaja berdasarkan istilah, tetapi juga pada isyarat lain yang berkaitan dengan senario pertanyaan, seperti industri atau peranan pencari. Senario boleh diberikan kepada ChatGPT dalam bentuk fakta atau dokumen dalam gesaan, atau secara pengaturcaraan dengan menunjuk kepada maklumat khusus yang menjadi asas respons.
Model bahasa berskala besar ialah perwakilan matematik bagi istilah, konsep dan hubungan yang terkandung dalam badan maklumat. Kuasa model bahasa yang besar terletak pada keupayaan mereka untuk memahami niat pengguna—apa yang dicari pengguna tanpa mengira cara permintaan itu dinyatakan—dan meramalkan corak perkataan yang berkemungkinan besar memberi respons kepada niat pengguna. Model "memahami" permintaan pengguna dan membuat ramalan tentang perkara yang harus dikembalikan. Enjin carian juga membuat ramalan berdasarkan pertanyaan pengguna, walaupun melalui mekanisme yang berbeza. Enjin carian boleh digunakan untuk menjana perolehan semula dalam senario kecerdasan buatan. Dapatkan semula kandungan menggunakan carian semantik atau enjin carian saraf dan gunakan model bahasa yang besar untuk memformatkan respons untuk pengguna.
Tesaurus memetakan istilah bukan pilihan kepada istilah pilihan (cth., peta "SOW" dan "Penyata Kerja" kepada "Cadangan", istilah pilihan yang menandakan dokumen). Fikirkan satu aspek model bahasa yang besar sebagai "tesaurus", tetapi bukan hanya perkataan, tetapi frasa dan konsep. Pengguna boleh bertanya soalan yang sama dalam pelbagai cara. Pengelasan niat ini bukan baharu dan merupakan asas untuk chatbots yang menghuraikan perubahan frasa kepada tindakan tertentu. Model bahasa adalah asas untuk menghurai niat dan keupayaan klasifikasi.
Model bahasa yang besar juga memahami pola perkataan yang mengikuti gesaan. Beginilah cara anda mendayakan kelancaran sesi ChatGPT. Kunci untuk menjadikannya berguna kepada perusahaan adalah untuk menyesuaikan model kepada kandungan atau badan pengetahuan tertentu (iaitu yang dilakukan oleh Morgan Stanley semasa melaksanakan ChatGPT) dan untuk menggabungkan istilah yang unik untuk perusahaan.
Terdapat banyak tutorial dengan contoh kod yang menggambarkan cara menggunakan model bahasa yang besar dengan kandungan tertentu. Sebagai contoh, videonya membimbing pembangun melalui proses menggunakan model bahasa seperti GPT-4 dan menunjuk chatbots pada pengetahuan dan kandungan tertentu.
Bot sembang khusus pengetahuan yang disesuaikan boleh menggunakan model bahasa yang besar untuk memahami permintaan pengguna dan kemudian mengembalikan hasil daripada sumber pengetahuan yang ditetapkan. Pembangun menyatakan bahawa kandungan perlu "dipotong" ke dalam bahagian "semantik bermakna". Kandungan terkomponen yang direka untuk menjawab soalan khusus perlu lengkap dan kontekstual. Adalah penting untuk ambil perhatian bahawa pengetahuan biasanya tidak wujud di negeri ini. Untuk membuat komponen, dokumen dan badan teks yang besar mesti dipecahkan kepada beberapa bahagian. Sebagai contoh, manual pengguna boleh dibahagikan kepada bahagian mengikut bab, bahagian, perenggan dan ayat. Dalam dunia dokumentasi teknikal, ini sudah dilakukan - piawaian seperti DITA (Darwin Information Classification Architecture) menggunakan pendekatan berasaskan topik yang sesuai untuk menjawab soalan.
Pembangun bercakap tentang "semantik" dan betapa pentingnya ia. Apakah maksud ini? Kandungan yang kaya secara semantik ditandakan dengan metadata yang memudahkan pengambilan semula maklumat yang diperlukan dan konteks maklumat yang tepat. Contohnya, jika pengguna menggunakan model penghala tertentu dan penghala itu mengeluarkan kod ralat, kandungan yang ditandakan dengan pengecam tersebut boleh diperoleh semula apabila meminta bantuan daripada bot sokongan. Proses ini juga dikenali sebagai "interpolasi" dalam dunia chatbot.
Kandungan tersuai diserap ke dalam apa yang dipanggil "ruang vektor", satu lagi model maklumat matematik yang meletakkan dokumen dalam ruang berbilang dimensi (yang merupakan binaan matematik), membenarkan Dokumen yang serupa dikelompokkan dan diambil semula . Ini dipanggil "benam". Pembenaman boleh mengandungi metadata dan pengecam (seperti sumber rujukan) yang membantu mendokumentasikan sebab jawapan khusus diberikan kepada pengguna. Ini penting untuk liabiliti undang-undang dan tujuan kawal selia serta jaminan bahawa maklumat yang betul dan paling berwibawa diberikan kepada pengguna.
Terdapat beberapa pandangan tentang "latihan". ChatGPT dan model bahasa besar dilatih mengenai jumlah kandungan yang besar, membolehkan mereka memahami pertanyaan pengguna dan membalas dengan jawapan optimum yang dibentuk dengan baik dan perbualan. Satu cara untuk melatih alat adalah dengan memasukkan dalam gesaan, "Jawab soalan ini berdasarkan maklumat berikut..."
Pertama, ChatGPT Sahaja jumlah kandungan tertentu boleh diproses dalam gesaan, jadi soalan jenis ini akan menjadi sangat terhad. Kandungan boleh diserap ke dalam alat, yang akan menyokong latihan tambahan. Walau bagaimanapun, menambah kandungan pada ChatGPT juga menggabungkan kandungan tersebut ke dalam model awam. Akibatnya, hak harta intelek syarikat akan terjejas. Risiko ini telah menyebabkan banyak perniagaan mengharamkan penggunaan ChatGPT dan alatan AI lain yang telah kehilangan harta intelek akibat memuat naik secara tidak sengaja rahsia korporat.
Selain itu, terdapat cara lain untuk melatih kandungan. Model bahasa yang besar boleh menggunakan pengetahuan khusus perusahaan sebagai sebahagian daripada korpus latihan, tetapi ini memerlukan penyediaan versi di sebalik tembok api. Nasib baik, model bahasa yang besar semakin cepat menjadi komoditi, dan ada juga yang boleh dijalankan secara asli pada komputer riba. Latihan jenis ini juga mahal dari segi pengiraan. Mekanisme lain ialah menggunakan model bahasa yang besar untuk mentafsir matlamat pengguna (niat mereka) dan kemudian menggunakan pembenaman vektor untuk menyediakan senario secara pemrograman daripada data atau sumber kandungan tertentu.
Respons kemudiannya diproses dan diformatkan oleh model bahasa untuk menjadikannya perbualan dan lengkap. Dengan cara ini, pengetahuan dipisahkan daripada model bahasa yang besar supaya rahsia perdagangan dan harta intelek syarikat tidak terjejas.
Semua faktor ini menunjukkan keperluan untuk pengurusan pengetahuan dan seni bina pengetahuan, yang menyusun maklumat ke dalam komponen supaya pengguna boleh mendapatkan jawapan kepada soalan khusus. Model bahasa yang besar dan sifat revolusioner ChatGPT menyampaikan kelancaran perbualan yang diperlukan untuk menyokong pengalaman pelanggan yang positif dengan tahap interaksi hampir manusia. Faktor utama ialah akses kepada pengetahuan yang tersusun dengan baik dalam perusahaan. ChatGPT kelihatan hebat, tetapi ia berdasarkan pemprosesan statistik maklumat dan ramalan corak. Maklumat, jika disusun dan disepadukan dengan betul, boleh menjadi bahagian penting dalam transformasi digital perniagaan.
Atas ialah kandungan terperinci Apakah maksud ChatGPT dan AI generatif dalam transformasi digital. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!