Gunakan enjin gunung berapi dan model besar untuk 'menyalakan' roda tenaga data-AI-php.cn

Rumah

Peranti teknologi

Gunakan enjin gunung berapi dan model besar untuk 'menyalakan' roda tenaga data

王林

Sep 20, 2023 pm 09:21 PM

enjin gunung berapi projek

Dalam proses model besar mengubah beribu-ribu industri, Volcano Engine menerajui dalam menyampaikan jawapan yang diperibadikan kepada industri data.

Pada 19 September, di "Sidang Kemuncak Teknologi Pacuan Data V-Tech Data Flywheel" yang diadakan di Shanghai, Volcano Engine mengumumkan keupayaan model bahasa besar (Model Bahasa Besar) platform kecerdasan digital VeDI.

Gunakan enjin gunung berapi dan model besar untuk menyalakan roda tenaga data

Selepas peningkatan produk, ia boleh menggunakan bahasa semula jadi untuk "mencari nombor", membantu pembangunan model gudang data, mengoptimumkan kod, dan juga melengkapkan penjanaan carta visual dan melaksanakan analisis atribusi semasa perbualan dan fungsi lain. Malah pengendali biasa tanpa kemahiran pengekodan boleh mencari nombor dan menganalisisnya dengan cepat. Pada masa ini, produk data berkaitan VeDI telah dijemput untuk ujian.

Produk data yang dinaik taraf telah banyak merendahkan ambang untuk menggunakan data. Pada masa lalu, jika pengendali biasa ingin mencari nombor itu, dia sering perlu meminta bantuan kakitangan R&D. Kakitangan R&D akan menulis kod untuk membantu mendapatkan nombor tersebut Menganalisis sekeping data yang diperlukan dengan menggabungkan banyak pengetahuan profesional. Kini, dengan bantuan produk data yang dinaik taraf, pengendali boleh memasukkan keperluan mereka dalam bahasa semula jadi pada bila-bila masa dan mendapatkan data yang mereka inginkan dalam masa nyata.

Ini akan merangsang lagi nilai data. Dalam perusahaan, ambang penggunaan yang lebih rendah akan membolehkan lebih ramai orang dalam rantaian penggunaan data mula menghubungi dan menggunakan data Keperluan data yang telah ditindas oleh ambang realistik pada masa lalu akan dipenuhi dan cerapan perniagaan berdasarkan data akan menjadi lebih tepat pada masanya. dan pembuatan keputusan akan lebih tepat pada masanya. Imaginasi perniagaan yang lebih saintifik dan berasaskan data akan dikeluarkan.

Bagi perusahaan yang sedang dalam proses pendigitalan, nilai data akan dikeluarkan dalam frekuensi peredaran yang lebih tinggi, dan roda tenaga data akan dipercepatkan lagi.

Model besar disepadukan ke dalam pautan data penuh, seterusnya mengurangkan ambang untuk pengeluaran dan penggunaan data

Berbanding dengan model kecil, model besar mempunyai keupayaan penaakulan alat generalisasi yang kuat dan keupayaan penaakulan luaran, kod Keupayaan penjanaan. Keupayaan ini mempunyai kesan yang ketara pada produk data.

Keupayaan penaakulan umum yang lebih kuat bermakna kecerdasan yang lebih tinggi, tetapi pada masa yang sama, ia juga perlu ditambah dengan menggabungkan banyak alat untuk menyesuaikan pelbagai kebolehan, seperti matematik dan kebolehan analisis. Model interaksi bahasa semula jadi yang dibuka pada era model besar juga telah membawa ruang imaginasi baharu kepada penggunaan produk data.

Bermula pada bulan Mac tahun ini, Byte secara dalaman mula menggabungkan model besar dengan produk data Dalam ujian berskala kecil dengan lelaran pantas, pasukan Luo Xuan tidak lama lagi mendapati bahawa dalam senario utama produk data, model besar The. penambahbaikan dan perubahan yang dibawa adalah jelas. Selepas itu, pasukan itu mula mencuba secara besar-besaran dalam senario produk data, sentiasa mengukur keutamaan senario, dan mempromosikan pelaksanaan model besar dalam produk.

Dalam proses model besar mengubah industri data, pemilihan senario adalah salah satu langkah paling kritikal Senario penggunaan yang sesuai bukan sahaja perlu diwujudkan berdasarkan teknologi semasa atau teknologi yang boleh dijangka, tetapi juga Ia adalah. dijamin bahawa selepas menambah model besar, pengguna atau pihak perniagaan boleh mendapat pengalaman yang lebih baik, dan pada masa yang sama membawa lebih banyak nilai penggunaan data, yang boleh memacu lagi pengeluaran data.

Luo Xuan berkongsi bahawa, sebagai contoh, jika penyelesaian asal hanya mengambil masa 1-2 saat dalam beberapa senario, selepas menggunakan model besar, disebabkan masalah kelewatan model besar, ia mungkin mengambil masa lebih daripada 5 saat untuk menggunakan bahasa semula jadi , maka senario ini tidak dapat memenuhi keperluan pengalaman perniagaan untuk ketepatan masa, dan ia tidak sah.

“Walau bagaimanapun, sebagai contoh, dalam proses penjanaan kod pendek, selepas menambah bahasa semula jadi, kecekapan adegan itu bertambah baik pada masa hadapan, kerana prestasi model besar terus bertambah baik, dalam semua aspek pautan data penuh, model besar boleh Perubahan pintar yang dibawa olehnya akan menjadi lebih berbaloi untuk dinanti-nantikan.”

Pada “Sidang Kemuncak Teknologi Pacuan Data V-Tech Data Flywheel”, peningkatan produk kecerdasan digital ini platform VeDI yang diumumkan oleh Volcano Engine terutamanya termasuk Terdapat dua bahagian: DataLeap dan DataWind. Antaranya, "Pembantu Nombor" dalam DataLeap boleh menyokong pencarian nombor dalam cara soal jawab, dan "Pembantu Pembangunan" boleh menyokong penjanaan dan pengoptimuman kod SQL dalam bahasa semula jadi yang DataWind - Pembantu Analisis; bahasa untuk melengkapkan pertanyaan dan analisis visualisasi data. Meliputi keseluruhan pautan mencari, mendapatkan semula dan menganalisis nombor, menurunkan ambang teknikal untuk keseluruhan proses pengeluaran dan penggunaan data.

DataLeap - Pembantu Mencari Nombor

"Mencari Nombor" biasanya merupakan langkah pertama dalam keseluruhan rantaian penggunaan data Hanya dengan mencari aset data yang betul boleh penggunaan data direalisasikan.Walau bagaimanapun, "mencari nombor" dalam proses tradisional bukanlah tugas yang mudah dan memerlukan pergantungan yang kuat pada input kepakaran perniagaan Biasanya orang hanya boleh mengesahkan melalui carian kata kunci dan kemudian menapis manual atau mencari pembangun data profesional. #🎜🎜 ##### 🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜#Gunakan DataLeap -Cari pembantu "find count"#🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜 🎜🎜# Fungsi "pembantu mencari nombor", digabungkan dengan model bahasa besar (LLM), sangat merendahkan ambang "mencari nombor".

Menggunakan "pembantu mencari nombor", orang yang tidak mempunyai kemahiran pengekodan juga boleh melakukan pertanyaan "antropomorfik" melalui bahasa semulajadi

Sebagai contoh, pengendali e-dagang boleh bertanya secara langsung: "Bilangan Haowu secara langsung bilik penyiaran dalam tujuh hari terakhir Keadaan perniagaan, apakah jadual yang harus digunakan?” DataLeap - Pembantu mencari data akan mengesyorkan jadual yang berkaitan dengan keadaan perniagaan berdasarkan pangkalan pengetahuan perniagaan dan menerangkan dimensi data yang sepadan dengan setiap jadual. Gunakan enjin gunung berapi dan model besar untuk menyalakan roda tenaga data

Pada masa ini, "Pembantu Berangka" boleh melaksanakan pelbagai jenis data dan fungsi berkaitan termasuk jadual Hive, set data, papan pemuka, penunjuk data, dimensi, dsb. .

Selain itu, selain memudahkan "mencari nombor", "pembantu mencari nombor" yang menggabungkan keupayaan model besar juga boleh menjadikan " mencari nombor" Kadar ketepatan dipertingkatkan lagi. Di bawah penyelesaian teknikal tradisional pada masa lalu, perolehan semula aset data bergantung pada pengurusan data berstruktur dan data perniagaan tidak berstruktur mungkin mempunyai sambungan yang hilang Apabila kata kunci digunakan untuk mendapatkan semula, masalah pemecahan pautan mungkin berlaku, yang mungkin mengurangkan bilangan data berdasarkan pada. senario perniagaan Cari dan gunakan dengan cekap. Di samping itu, carian menyediakan satu set jawapan calon berdasarkan kata kunci, yang memerlukan pemeriksaan dan pengesahan manual, ia bukan jawapan langsung, menyukarkan pengguna untuk mendapat pengalaman yang baik.

Kini, dalam proses perbualan dengan pengguna, model bahasa besar (LLM) dapat memahami niat sebenar pengguna dan menjadikan proses carian lebih fokus . Ia menjimatkan kos pertimbangan manusia, dan "mencari nombor" itu sendiri menjadi lebih cepat Pada masa yang sama, dengan peningkatan beransur-ansur kebolehan pemahaman semantik dan analisis model, perolehan semula perbualan mempunyai kecekapan perolehan pautan penuh berbanding kata kunci mudah. pengambilan juga lebih tinggi.

DataLeap - Pembantu Pembangunan

#🎜🎜🎜##🎜🎜🎜##🎜🎜🎜##🎜 🎜#Dalam proses pengeluaran dan pemprosesan data, "Pembantu Pembangunan" boleh menyokong penggunaan bahasa semula jadi dan menjana kod SQL secara automatik untuk kod sedia ada, ia secara automatik boleh melaksanakan pembaikan pepijat, pengoptimuman kod, penjelasan dan anotasi, dan lain-lain , ia juga boleh melaksanakan dokumentasi melalui dialog Konsultasi mengenai isu penggunaan SQL seperti carian, penggunaan fungsi, contoh kod, dll.

Bangun kod SQL secara automatik

#🎜🎜🎜🎜🎜 🎜🎜#

#🎜 🎜# Lapisan bawah pembantu pembangunan menggunakan model bahasa besar (LLM) Selepas latihan kod dan korpus besar-besaran, ia secara automatik boleh mengaitkan maklumat metadata termasuk skema jadual mengikut input bahasa semula jadi pengguna, menjana kod pemprosesan data berkualiti tinggi, dan Keupayaan untuk memahami, menulis semula, dan kod soal jawab.

#🎜🎜 ## 自动##🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜 ## 🎜🎜#

Pembantu pembangunan memecahkan halangan bahasa, yang sangat mengurangkan had pembangunan data “Pada asalnya, untuk (memproses) data, anda mungkin perlu mengetahui bahasa pengaturcaraan, seperti SQL atau Python, yang merupakan keperluan kemahiran yang agak kuat Namun, kini anda tidak lagi memerlukan bahasa pengaturcaraan dan boleh menggunakan bahasa semula jadi. Ini bermakna keperluan untuk orang yang melakukan ini telah dikurangkan lagi.” Kakitangan operasi yang tidak memahami SQL juga boleh melakukan beberapa ETL asas. ^{Pengendali boleh membenarkan DataLeap menjana kod permintaan data secara automatik yang sepadan dengan keadaan perniagaan, seperti pesanan jualan mengikut bandar atau trafik bilik siaran langsung mengikut tempoh masa, dsb. Operator juga boleh bertanya tentang maksud kod, seperti "Adakah terdapat sebarang rancangan pengoptimuman semasa jadual ini berjalan?", atau mereka boleh mengadakan perbualan: "Bantu saya menyemak dan membetulkan rentetan kod ini." Anda juga boleh menghuraikan kod yang dijana dengan satu klik, memanggil alat SQL untuk menyemak jadual, dan klik untuk mengesahkan pembaikan automatik AI untuk mengoptimumkan lagi aset data.}

Lebih penting, untuk pembangun profesional, DataLeap - Pembantu Pembangunan boleh membantu mereka melakukan beberapa kerja asas dan memproses data daripada analisis data Jurutera dan pengendali perniagaan yang bergantung pada data mempunyai beberapa keperluan yang kompleks tetapi asas Jurutera hanya perlu membetulkan dan menyemak ketepatan kod yang dihasilkan pada akhir.

Hasilnya, kakitangan R&D boleh menumpukan pada kerja yang lebih kreatif, lebih menumpukan kepada keperluan senario yang kompleks, menggunakan pembantu pembangunan untuk mengoptimumkan kod dan meningkatkan produktiviti dan kualiti kod P&P.

DataWind - Pembantu Analisis

#🎜🎜🎜##🎜🎜🎜##🎜🎜🎜##🎜 🎜#
Setelah menyedari pencarian dan perolehan nombor, kami datang ke pautan analisis data. DataWind - Pembantu Analisis, yang menggabungkan keupayaan model yang besar, boleh membantu orang dalam kedudukan bukan analitik menyelesaikan satu siri penerokaan perniagaan seperti pertanyaan dan analisis visualisasi data melalui dialog bahasa semula jadi, menurunkan ambang untuk pautan ini.

Pertama ialah penciptaan "set data". Dengan aset data, pengendali menggunakan kaedah drag-and-drop DataWind untuk mencipta set data, dan kemudian menggunakan bahasa semula jadi untuk mentakrifkan logik medan yang berbeza, seperti menyemak terus data "tempoh siaran langsung selebriti besar".

Generasi medan

#🎜##🎜🎜🎜##🎜 🎜#

Selepas menyemak, pengendali boleh melakukan analisis visual dan penerokaan. Pada masa lalu, alat BI biasanya menggunakan operasi drag-and-drop Walaupun ambang telah diturunkan dalam pengeluaran papan pemuka, dalam bidang analisis dan cerapan, sejumlah besar pengetahuan profesional masih diperlukan untuk memahami data dengan lebih baik satu "ambang".

Penerokaan visual#🎜🎜🎜#

Penerokaan visual#🎜🎜🎜🎜##🎜##🎜## 🎜🎜#

Walau bagaimanapun, dengan berkat keupayaan penaakulan umum yang lebih kukuh bagi model besar, DataWind telah dapat menjalankan andaian dan pengesahan asas serta mencadangkan idea analisis.

Fungsi analisis automatik AI yang disediakan oleh DataWind boleh menyokong penerokaan lanjut tentang sebab di sebaliknya berdasarkan carta. Sebagai contoh, AI boleh menganalisis secara automatik carta visual yang dijana seperti "graf trafik bilik siaran langsung mengikut tempoh masa" dan "kawasan teratas jualan bilik siaran langsung hanya perlu membuat atribusi lanjut melalui dialog berdasarkan hasil analisis". Gunakan enjin gunung berapi dan model besar untuk menyalakan roda tenaga data

Pada masa yang sama, DataWind juga berhubung dengan alat kerjasama pejabat seperti Feishu Pengguna boleh menjalankan analisis yang lebih lanjutan melalui langganan mesej IM dan perbualan semula jadi capai bila-bila masa Analisis fleksibel di mana-mana sahaja, memenuhi kecerdasan layan diri merentas keseluruhan rangkaian daripada set data, cerapan visual, langganan mesej, dll., dan penyepaduan pejabat China Unicom membolehkan analisis data disepadukan dengan lancar ke dalam kehidupan seharian.

Mesej IM yang diselaraskan Langgan untuk analisis sambungan

Analisis ambang untuk pembantu analisis akan mengurangkan lagi ambang analisis Daripada membaca "rajah data" untuk memahami secara langsung keputusan melalui dialog bahasa semula jadi, analisis data dan kitaran pemikiran telah sangat dipendekkan untuk menyelesaikan analisis masa lalu analisis masa lalu Dapatkan pandangan tentang titik kesakitan yang memerlukan banyak pengetahuan profesional dan memendekkan kitaran analisis data.

Pada peringkat ini, senario aplikasi DataWind - Pembantu Analisis sudah sangat kaya Di samping membolehkan penerokaan perbualan dalam senario analisis teras, Pembantu Analisis juga memperluaskan keupayaannya kepada penjanaan ekspresi dan tugas lain yang sebelum ini memerlukan lebih banyak. ambang teknikal di tempat kejadian.

Model besar mempercepatkan roda tenaga data untuk membantu perusahaan mencapai lebih baik dipacu data

ByteDance mempunyai gen terdorong data yang mendalam. Sejak penubuhannya, hampir semua senario dalam ByteDance telah tertakluk kepada ujian A/B dan pelarasan dibuat melalui maklum balas data untuk memacu strategi perniagaan, seperti sama ada kesan pengoptimuman kualiti video Douyin adalah baik, sama ada pengoptimuman strategi algoritma pengesyoran adalah tepat, malah Nama Toutiao juga telah diuji A/B.

Dalam Byte, skop penggunaan data adalah sangat luas. Dari segi organisasi, semua orang daripada pengurusan atasan hingga pertengahan, serta pekerja barisan hadapan, pada asasnya boleh melihat data dan menggunakan data untuk menilai status operasi, hasil dan perbelanjaan syarikat, kemajuan perniagaan dan strategi produk. Dalam senario tertentu, seperti pemasaran masa nyata dalam e-dagang langsung, reka bentuk operasi dan mendorong strategi pemasaran yang sepadan berdasarkan data masa nyata.

Byte telah mencapai keputusan saintifik dan tindakan tangkas melalui penggunaan data, yang telah meningkatkan nilai perniagaan melalui penggunaan data yang kerap dan pendapatan perniagaan, ia telah menyasarkan pembinaan aset data berkualiti tinggi pada kos rendah kepada lebih baik; menyokong aplikasi perniagaan.

Pada bulan April tahun ini, berdasarkan pengalaman praktikal yang dipacu data ByteDance lebih sepuluh tahun, Volcano Engine mengeluarkan paradigma baharu peningkatan kecerdasan digital perusahaan, "Data Flywheel", menggunakan "Data Flywheel" sepenuhnya. meringkaskan aliran data perusahaan Selepas disepadukan ke dalam aliran perniagaan, ia boleh mencapai kesan roda tenaga untuk menambah baik aset data dan aplikasi perniagaan.

Di bawah aliran keseluruhan pendigitalan, perniagaan korporat dalam beribu-ribu industri semakin hampir kepada pendigitalan, dan data menjadi semakin penting kepada perusahaan. Sebagai faktor pengeluaran baharu, data menyokong transformasi digital dan pintar perusahaan. Tetapi secara objektif bercakap, walaupun banyak syarikat telah melakukan banyak pembinaan digital, mereka tidak dapat mengeluarkan sepenuhnya nilai data.

"Sebuah perusahaan mungkin menggunakan produk data pada harga yang tinggi, tetapi mungkin terdapat sangat sedikit orang yang benar-benar menggunakannya secara dalaman. Jika data sukar untuk mengalir, ia akan menjadi sukar untuk merealisasikan nilainya." diperhatikan dalam pasaran produk data,

Banyak Perusahaan yang sedang menjalani pembinaan digital menghadapi masalah seperti kos pembinaan dan pengurusan data yang tinggi, halangan tinggi untuk menggunakan produk data, dan nilai aset data yang rendah.

Dari perspektif keseluruhan proses pendigitalan, sukar tetapi betul untuk menjadi "didorong data". Mengambil Byte sebagai contoh, Luo Xuan mendedahkan bahawa pada masa ini, 80% pekerja ByteDance boleh menggunakan produk data secara langsung, dan aset data yang boleh diurus dan beroperasi meliputi 80% daripada senario analisis harian. Berdasarkan pengalaman Byte, ini bermakna kadar penggunaan produk data dalaman dalam perusahaan dan liputan aset data terurus dan operasi dalam senario perlu ditingkatkan ke tahap yang lebih tinggi untuk membentuk "roda tenaga data" yang baik dalam syarikat.

Dalam proses ini, produk data yang disokong oleh model besar mungkin menjadi daya penggerak penting dalam membantu syarikat mencapai matlamat mereka.

Platform kecerdasan digital VeDI, yang telah dinaik taraf dengan keupayaan model yang besar, mengurangkan lagi keseluruhan proses pengeluaran dan penggunaan data seperti pencarian nombor, perolehan nombor dan analisis data. Di bawah tahap permintaan yang sama, menggunakan VeDI yang dinaik taraf, bilangan orang dalam syarikat yang mempunyai keupayaan untuk menggunakan produk data telah berkembang daripada penganalisis data profesional kepada semua orang yang mempunyai keperluan data, yang mungkin operasi, bos, pengurus produk, dsb., Penggunaan data menjadi inklusif.

"Hanya dengan menurunkan ambang dan menggunakan data kita boleh mengetahui jenis nilai yang akan dijana oleh data dalam peredaran." khazanah yang digali dan produk data ambang rendah mungkin menjadi kunci untuk membuka kuncinya.

Dengan sokongan model besar, "roda tenaga data" dalam perusahaan akan mempercepatkan putarannya.

Perniagaan syarikat mempunyai enjin yang lebih berkuasa, dan kakitangan perniagaan boleh mendapatkan maklum balas data dengan cepat daripada "data keluar dalam beberapa saat", dengan itu mengoptimumkan perniagaan dengan lebih pantas Dalam proses aliran data yang dipercepatkan, lebih banyak aset data berkualiti tinggi terus terkumpul. Beri perniagaan lebih cerapan dan akhirnya membuat keputusan perniagaan lebih saintifik dan tangkas.

Atas ialah kandungan terperinci Gunakan enjin gunung berapi dan model besar untuk 'menyalakan' roda tenaga data. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

3 minggu yang lalu By DDD

Apa yang Baru di Windows 11 KB5054979 & Cara Memperbaiki Masalah Kemas Kini

2 minggu yang lalu By DDD

Akan R.E.P.O. Ada Crossplay?

1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7555

Tutorial CakePHP

1383

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

Pengarang ControlNet mendapat satu lagi kejayaan! Seluruh proses menghasilkan lukisan daripada gambar, memperoleh 1.4k bintang dalam masa dua hari Jul 17, 2024 am 01:56 AM

Ia juga merupakan video Tusheng, tetapi PaintsUndo telah mengambil laluan yang berbeza. Pengarang ControlNet LvminZhang mula hidup semula! Kali ini saya menyasarkan bidang lukisan. Projek baharu PaintsUndo telah menerima 1.4kstar (masih meningkat secara menggila) tidak lama selepas ia dilancarkan. Alamat projek: https://github.com/lllyasviel/Paints-UNDO Melalui projek ini, pengguna memasukkan imej statik, dan PaintsUndo secara automatik boleh membantu anda menjana video keseluruhan proses mengecat, daripada draf baris hingga produk siap . Semasa proses lukisan, perubahan garisan adalah menakjubkan Hasil akhir video sangat serupa dengan imej asal: Mari kita lihat lukisan lengkap.

Mendahului senarai jurutera perisian AI sumber terbuka, penyelesaian tanpa ejen UIUC dengan mudah menyelesaikan masalah pengaturcaraan sebenar SWE-bench Jul 17, 2024 pm 10:02 PM

Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Semua pengarang kertas kerja ini adalah daripada pasukan guru Zhang Lingming di Universiti Illinois di Urbana-Champaign (UIUC), termasuk: Steven Code repair; pelajar kedoktoran tahun empat, penyelidik

Kerja selepas kematian Pasukan Penyelarasan Super OpenAI: Dua model besar bermain permainan, dan output menjadi lebih mudah difahami Jul 19, 2024 am 01:29 AM

Jika jawapan yang diberikan oleh model AI tidak dapat difahami sama sekali, adakah anda berani menggunakannya? Memandangkan sistem pembelajaran mesin digunakan dalam bidang yang lebih penting, menjadi semakin penting untuk menunjukkan sebab kita boleh mempercayai output mereka, dan bila tidak mempercayainya. Satu cara yang mungkin untuk mendapatkan kepercayaan dalam output sistem yang kompleks adalah dengan menghendaki sistem menghasilkan tafsiran outputnya yang boleh dibaca oleh manusia atau sistem lain yang dipercayai, iaitu, difahami sepenuhnya sehingga apa-apa ralat yang mungkin boleh dilakukan. dijumpai. Contohnya, untuk membina kepercayaan dalam sistem kehakiman, kami memerlukan mahkamah memberikan pendapat bertulis yang jelas dan boleh dibaca yang menjelaskan dan menyokong keputusan mereka. Untuk model bahasa yang besar, kita juga boleh menggunakan pendekatan yang sama. Walau bagaimanapun, apabila mengambil pendekatan ini, pastikan model bahasa menjana

Daripada RLHF kepada DPO kepada TDPO, algoritma penjajaran model besar sudah pun 'peringkat token' Jun 24, 2024 pm 03:04 PM

Lajur AIxiv ialah lajur di mana tapak ini menerbitkan kandungan akademik dan teknikal. Dalam beberapa tahun kebelakangan ini, lajur AIxiv laman web ini telah menerima lebih daripada 2,000 laporan, meliputi makmal terkemuka dari universiti dan syarikat utama di seluruh dunia, mempromosikan pertukaran dan penyebaran akademik secara berkesan. Jika anda mempunyai kerja yang sangat baik yang ingin anda kongsikan, sila berasa bebas untuk menyumbang atau hubungi kami untuk melaporkan. E-mel penyerahan: liyazhou@jiqizhixin.com; zhaoyunfeng@jiqizhixin.com Dalam proses pembangunan kecerdasan buatan, kawalan dan bimbingan model bahasa besar (LLM) sentiasa menjadi salah satu cabaran utama, bertujuan untuk memastikan model ini adalah kedua-duanya. berkuasa dan selamat untuk masyarakat manusia. Usaha awal tertumpu kepada kaedah pembelajaran pengukuhan melalui maklum balas manusia (RL

Kesan pemasaran telah banyak dipertingkatkan, ini adalah cara penciptaan video AIGC harus digunakan Jun 25, 2024 am 12:01 AM

Selepas lebih setahun pembangunan, AIGC telah beransur-ansur beralih daripada dialog teks dan penjanaan gambar kepada penjanaan video. Mengimbas kembali empat bulan lalu, kelahiran Sora menyebabkan rombakan dalam trek penjanaan video dan menggalakkan skop dan kedalaman aplikasi AIGC dalam bidang penciptaan video. Dalam era apabila semua orang bercakap tentang model besar, di satu pihak kita terkejut dengan kejutan visual yang dibawa oleh penjanaan video, sebaliknya kita berhadapan dengan kesukaran pelaksanaan. Memang benar bahawa model besar masih dalam tempoh berjalan dari penyelidikan dan pembangunan teknologi kepada amalan aplikasi, dan mereka masih perlu ditala berdasarkan senario perniagaan sebenar, tetapi jarak antara ideal dan realiti semakin disempitkan secara beransur-ansur. Pemasaran, sebagai senario pelaksanaan penting untuk teknologi kecerdasan buatan, telah menjadi hala tuju yang banyak syarikat dan pengamal ingin membuat penemuan. Sebaik sahaja anda menguasai kaedah yang sesuai, proses kreatif video pemasaran akan menjadi

Kertas arXiv boleh disiarkan sebagai 'bertubi-tubi', platform perbincangan Stanford alphaXiv dalam talian, LeCun menyukainya Aug 01, 2024 pm 05:18 PM

sorakan! Bagaimana rasanya apabila perbincangan kertas adalah perkataan? Baru-baru ini, pelajar di Universiti Stanford mencipta alphaXiv, forum perbincangan terbuka untuk kertas arXiv yang membenarkan soalan dan ulasan disiarkan terus pada mana-mana kertas arXiv. Pautan laman web: https://alphaxiv.org/ Malah, tidak perlu melawati tapak web ini secara khusus. Hanya tukar arXiv dalam mana-mana URL kepada alphaXiv untuk terus membuka kertas yang sepadan di forum alphaXiv: anda boleh mencari perenggan dengan tepat dalam. kertas itu, Ayat: Dalam ruang perbincangan di sebelah kanan, pengguna boleh menyiarkan soalan untuk bertanya kepada pengarang tentang idea dan butiran kertas tersebut Sebagai contoh, mereka juga boleh mengulas kandungan kertas tersebut, seperti: "Diberikan kepada

Satu kejayaan ketara dalam Hipotesis Riemann! Tao Zhexuan amat mengesyorkan kertas kerja baharu daripada MIT dan Oxford, dan pemenang Fields Medal berusia 37 tahun mengambil bahagian Aug 05, 2024 pm 03:32 PM

Baru-baru ini, Hipotesis Riemann, yang dikenali sebagai salah satu daripada tujuh masalah utama milenium, telah mencapai kejayaan baharu. Hipotesis Riemann ialah masalah yang tidak dapat diselesaikan yang sangat penting dalam matematik, berkaitan dengan sifat tepat taburan nombor perdana (nombor perdana ialah nombor yang hanya boleh dibahagikan dengan 1 dan dirinya sendiri, dan ia memainkan peranan asas dalam teori nombor). Dalam kesusasteraan matematik hari ini, terdapat lebih daripada seribu proposisi matematik berdasarkan penubuhan Hipotesis Riemann (atau bentuk umumnya). Dalam erti kata lain, sebaik sahaja Hipotesis Riemann dan bentuk umumnya dibuktikan, lebih daripada seribu proposisi ini akan ditetapkan sebagai teorem, yang akan memberi kesan yang mendalam terhadap bidang matematik dan jika Hipotesis Riemann terbukti salah, maka antara cadangan ini sebahagian daripadanya juga akan kehilangan keberkesanannya. Kejayaan baharu datang daripada profesor matematik MIT Larry Guth dan Universiti Oxford

Latihan aksiomatik membolehkan LLM mempelajari penaakulan kausal: model 67 juta parameter adalah setanding dengan trilion tahap parameter GPT-4 Jul 17, 2024 am 10:14 AM

Tunjukkan rantai sebab kepada LLM dan ia mempelajari aksiom. AI sudah pun membantu ahli matematik dan saintis menjalankan penyelidikan Contohnya, ahli matematik terkenal Terence Tao telah berulang kali berkongsi pengalaman penyelidikan dan penerokaannya dengan bantuan alatan AI seperti GPT. Untuk AI bersaing dalam bidang ini, keupayaan penaakulan sebab yang kukuh dan boleh dipercayai adalah penting. Penyelidikan yang akan diperkenalkan dalam artikel ini mendapati bahawa model Transformer yang dilatih mengenai demonstrasi aksiom transitiviti sebab pada graf kecil boleh digeneralisasikan kepada aksiom transitiviti pada graf besar. Dalam erti kata lain, jika Transformer belajar untuk melakukan penaakulan sebab yang mudah, ia boleh digunakan untuk penaakulan sebab yang lebih kompleks. Rangka kerja latihan aksiomatik yang dicadangkan oleh pasukan adalah paradigma baharu untuk pembelajaran penaakulan sebab berdasarkan data pasif, dengan hanya demonstrasi

See all articles