Apa yang anda fikirkan apabila anda melihat bintang?
Jika anda bertanya soalan secara berterusan, anda akan mendapat jawapan yang tidak pernah anda bayangkan.
shen
Mereka yang mencipta alam semesta baharu dari dalam satu inci persegi ke luar alam semesta percaya bahawa mereka tidak dapat melihat siling.
Orang yang berazam tidak akan berhenti hanya kerana mereka tiba dengan kadar yang tidak diketahui.
Persidangan Baidu CREATE 2022 menunjukkan kepada kami lukisan hasil ciptaan bersama oleh pereka manusia dan AIGC.
Dan seperti adegan yang diterangkan dalam lukisan ini, Baidu tidak pernah berhenti berinovasi.
Pada permulaan persidangan, Robin Li mengemukakan sudut pandangan yang menggugah pemikiran: simbol revolusi teknologi keempat ialah algoritma pembelajaran mendalam. Inovasi utama yang berkaitan dengan pembelajaran mendalam akan memberi kesan besar kepada masyarakat kita, sama seperti kereta dan Internet.
Dalam amalan sebenar, tiada peta navigasi, hanya kompas . Baidu juga menghasilkan inovasi berharga selepas memikirkan hala tuju umum dan mengulang langkah demi langkah berdasarkan amalan.
Di persidangan itu, Robin Li menunjukkan lukisan sedemikian. Lukisan ini dijana pada platform lukisan Baidu AI menggunakan kata kunci "krisis dan harapan".
Lukisan ini mewakili situasi semasa yang dihadapi oleh kecerdasan buatan - mengalami pasang surut, tetapi penuh harapan.
Ya, Robin Li masih berpegang pada pandangan tahun lalu bahawa pencipta akan memulakan dekad keemasan kecerdasan buatan.
2022, AIGC sedang rancak.
DALL·E2 telah menjadikan gambar hasil teks popular selama setahun. Selepas itu, Stable Diffussion dan Midjourney telah mengilhamkan inspirasi artistik yang tidak terkira banyaknya malah mengejutkan ramai pelukis.
Model Imagen yang dikeluarkan oleh DALL·E2 dan Google juga telah menarik ramai sarjana AI untuk mengambil bahagian dalam penyelidikan.
Walaupun ChatGPT hanya membuat debutnya pada penghujung tahun, keajaiban yang diberikan kepadanya oleh "pembelajaran pengukuhan" membolehkannya sekali lagi mencetuskan ribut di AIGC semasa karnival kebangsaan .
Malah, pada awal tahun 2022, Institut Penyelidikan Baidu telah pun meramalkan populariti AIGC tahun ini.
Model pra-latihan berskala ultra besar menunjukkan trend peningkatan pengetahuan, pemodelan bersatu merentas mod, dan evolusi bersama pelbagai kaedah pembelajaran, dan secara beransur-ansur menjadi praktikal .
Sebagai contoh, AIGC (kandungan jana AI, kandungan ciptaan kecerdasan buatan), dengan bantuan keupayaan teknikal komprehensif merentas mod model besar, boleh merangsang kreativiti, meningkatkan kepelbagaian kandungan, mengurangkan kos pengeluaran, dan Akan mencapai aplikasi berskala besar.
Selain itu, ini bukan kali pertama Institut Penyelidikan Baidu membuat ramalan ilahi. Pada tahun 2020, model NLP yang diramalkannya telah dipenuhi pada GPT-3, dan pada tahun 2021, orang digital yang dipertaruhkan telah meletup.
Tetapi kali ini, Baidu sangat yakin dengan trend dalam bidang AIGC.
Tiga pencipta berbakat, satu klik untuk merealisasikan impian anda mengarah
Pada persidangan Create 2022, Baidu menggunakan AIGC secara mendalam pada hampir setiap pautan. Penciptaan lagu, adegan dan peta minda pertuturan semuanya melibatkan AI.
Lukisan yang dihasilkan oleh Robin Li dengan tema "krisis dan harapan" adalah berdasarkan pengetahuan budaya- mod silang dipertingkatkan Terdapat model berskala besar, dan ia adalah salah satu daripada tiga pencipta berbakat yang akan muncul seterusnya.
Pada persidangan Create ini, Wu Hua, Pengerusi Jawatankuasa Teknikal Baidu, memperkenalkan kami kepada tiga pencipta berbakat dengan kebolehan luar biasa.
Mereka ialah penulis skrip berbakat - Wenxin ERNIE3.0Zeus, ilustrator berbakat - Wenxin ERNIE-ViLG 2.0, dan pakar penyuntingan dan animasi - VIMER-TCIR.
Dengan tiga pencipta berbakat ini, ditambah dengan pelakon maya reka bentuk anda sendiri, anda juga boleh menjadi pengarah dan penggambaran filem anda sendiri dan karya televisyen!
Model bahasa Wenxin ERNIE 3.0 Zeus akan bersembang dengan anda selama-lamanya!
Sebagai peningkatan terkini model siri ERNIE 3.0, selain mempelajari data dan graf pengetahuan yang tidak berlabel, ERNIE 3.0 Zeus juga mempelajari lebih daripada seratus bentuk yang berbeza melalui berterusan pembelajaran Kawalan komprehensif data tugas dicapai.
Selepas "pendekatan serampang dua mata" kepada pengetahuan am dan pengetahuan khusus, keupayaan generalisasi model telah dipertingkatkan dengan ketara sama ada pemahaman berbilang bahasa atau tugas penjanaan mudah dikendalikan, sesuai dengan nama " "Generalis" tergolong dalam kategori.
Sama ada ciptaan bebas, jawapan percuma, dialog proposisi, analisis emosi dan lebih daripada 100 gesaan hierarki, ERNIE 3.0 Zeus boleh menanganinya dengan lancar.
Wenxin ERNIE-ViLG 2.0 model besar generasi imej, pelukis berbakat, tahukah anda?
Jika Wenxin ERNIE 3.0 Zeus ialah mahir bahasa, ERNIE-ViLG 2.0 ialah mahir melukis. Ia boleh menghasilkan lukisan yang cantik berdasarkan ayat atau perenggan teks deskriptif.
Petua Cina, kalau nak lukis apa-apa, tanya saja tak ada yang tak terfikir dan tak boleh dia lukis Lihatlah kapal ini Adakah kapal perang porselin biru dan putih kelihatan seperti karya seni yang baik? Saya tidak tahu sama ada mereka akan ditembak berkeping-keping jika mereka benar-benar bertarung...
Untuk mencapai matlamat ini, kita tidak boleh melakukannya tanpa penyebaran pengetahuan yang dipertingkatkan di sebalik model itu sendiri .
Antara gesaan dalam satu ayat atau beberapa ayat, yang manakah unsur inti yang perlu ditonjolkan dalam lukisan, dan yang manakah unsur hiasan?
Untuk mencapai lukisan yang tepat sebanyak mungkin, semasa proses pembelajaran, ERNIE ViLG 2.0 memperkenalkan pengetahuan pelbagai sumber seperti bahasa dan penglihatan untuk membimbing model untuk memberi lebih perhatian Elemen semantik teras dalam teks dan imej untuk mencapai kawalan semantik halus yang tepat.
Selain itu, ERNIE ViLG 2.0 juga boleh memilih rangka kerja pemodelan rangkaian yang berbeza (seperti pengurangan hingar) untuk peringkat yang berbeza, menyelesaikan masalah keperluan yang tidak konsisten untuk keupayaan model pada peringkat yang berbeza dengan berkesan dan mengurangkan Ia menghapuskan gangguan bersama tugas pengurangan hingar dan meningkatkan kualiti penjanaan imej.
Sama ada gaya realistik, gaya Cina, aliran kebangsaan atau gaya lukisan Cina, ERNIE-ViLG 2.0 boleh menjana gaya yang paling atas, gaya berbeza dan berdasarkan imej yang jelas pada gesaan Cina pendek Imej realistik.
Sebagai contoh, ambil "Feast in Heaven" yang cantik dan elegan berikut:
Berdasarkan Gaya sastera dan gaya unik ERNIE-ViLG 2.0 telah menyampaikan karya komprehensif yang boleh dikatakan komprehensif Gaya lukisan keseluruhannya cerah dan berwarna-warni, tanpa kehilangan sentimen kuno.
Kini, kami hanya perlu memasukkan beberapa kata kunci pada platform “Wenxin·Yige” Baidu dan kami boleh mendapatkan gaya unik dalam lukisan minit.
Selain bahasa dan imej, penjanaan dan penyuntingan kandungan video juga merupakan tempat model besar Wen Xin menunjukkan bakatnya.
Dari segi penjanaan kandungan visual, model penjanaan video besar secara automatik boleh menjana kandungan berdasarkan teks penerangan atau imej yang disediakan oleh pengguna. Hasilkan video definisi tinggi dan lancar dengan cekap.
Dari segi penyuntingan visual, model besar berbilang tugas VIMER-TCIR boleh digunakan untuk peleraian super, denosing, nyahkabur dan penyahmampatan Pra-latihan bersama untuk pelbagai tugas, dan pembaikan dan penyuntingan pelbagai situasi berbeza pada masa yang sama.
Pada masa ini, VIMER-TCIR telah dilaksanakan dalam adegan seperti pemulihan filem lama, dan telah meningkatkan kecekapan operasi dengan ketara. Satu mesin boleh membaiki 285,000 bingkai video setiap hari, menyelesaikan kebanyakannya masalah filem lama isu pembaikan skrin.
Gelombang AIGC telah tiba pada masa hadapan, adalah dijangka bahawa lukisan AI, penciptaan video AI, dsb. akan menjadi It's as semudah mengambil gambar dengan telefon anda.
Dengan penemuan berterusan dalam teknologi, AIGC berkemungkinan besar akan menumbangkan model pengeluaran kandungan sedia ada dan mencipta kandungan pada satu per sepuluh daripada kos dan pada kelajuan pengeluaran seratus kali seribu kali. Kandungan dengan nilai unik dan perspektif bebas.
Untuk mencapai kesan hebat pada model besar, Baidu tidak kedekut dalam penyelidikan dan pembangunan .
Sejumlah lebih 100 bilion yuan telah dilaburkan dalam tempoh sepuluh tahun yang lalu, yang mana pelaburan teras R&D telah menyumbang lebih daripada 20% hasil teras untuk 8 suku berturut-turut.
Menurut statistik, intensiti pelaburan R&D Baidu pada 2020 ialah 18.22%, menduduki tempat pertama dalam kalangan 500 perusahaan swasta terbaik. Pada 2021, ia adalah 20.03%, menduduki tempat kedua dalam kalangan 500 perusahaan swasta teratas.
Omong-omong, pelaburan yang "murah hati" juga telah memberikan Baidu kelebihan utama dalam teknologi asas kecerdasan buatan .
Lagipun, jika cip tersekat, begitu juga dengan perisian asas.
Seawal 2016, Baidu mula membangunkan rangka kerja pembelajaran mendalam yang dipanggil Fei Paddle, yang dipanggil "sistem pengendalian kecerdasan buatan".
Pada masa ini, 5.35 juta pembangun telah dikumpulkan, 670,000 model telah dicipta, dan ekosistem pembelajaran mendalam yang makmur telah dibina.
Model besar berdasarkan dayung terbang juga boleh menyepadukan keupayaan pelbagai mod seperti pemprosesan bahasa semula jadi dan penglihatan komputer, dan boleh dioptimumkan bersama dengan pelbagai senario perniagaan industri; juga Membina aplikasi AI seperti blok binaan sangat merendahkan ambang untuk aplikasi AI.
Kami telah menyebut di awal artikel yang Robin Li percaya bahawa inovasi utama yang berkaitan dengan pembelajaran mendalam, termasuk pemanduan autonomi, sistem penghantaran pintar dalam tenaga hidro dan bidang lain, akan mempunyai kesan sosial yang ketara.
Dari manakah datangnya inovasi itu sendiri? Pada pandangan Robin Li, inovasi didorong oleh maklum balas.
Baidu mempunyai banyak pengalaman praktikal dalam "inovasi dipacu maklum balas" dalam pembangunan perniagaannya. Sebagai contoh, sebab mengapa cip Baidu Kunlun mendahului prestasi dalam kalangan cip AI adalah tepat kerana ia telah dioptimumkan untuk perkhidmatan carian Baidu selama sepuluh tahun.
Perkhidmatan carian Baidu bertindak balas kepada berbilion-bilion keperluan pengguna sebenar setiap hari, melakukan 1 trilion kali penaakulan dan pemadanan semantik yang mendalam setiap hari, dan boleh memberikan maklum balas yang paling tulen dan tepat pada masanya memaksa pengoptimuman model besar, rangka kerja pembelajaran mendalam dan cip.
Kini, Baidu ialah salah satu daripada beberapa syarikat kecerdasan buatan di dunia yang mempunyai susun atur tindanan penuh (lapisan cip, lapisan rangka kerja, lapisan model dan lapisan aplikasi).
Dari cip mewah Kunlun, kepada rangka kerja pembelajaran mendalam dayung terbang, kepada model besar pra-latihan Wenxin, terdapat kunci diri -teknologi yang dibangunkan pada setiap peringkat, terdapat banyak maklum balas antara setiap lapisan, dan pengoptimuman hujung ke hujung dicapai dengan mendapatkan maklum balas secara berterusan.
Seni bina teknikal setiap lapisan menjadi lebih umum apabila anda turun dan lebih khusus apabila anda naik.
Semakin kecerdasan buatan yang lebih khusus, lebih banyak ia boleh menembusi ke dalam industri dan memperkasakan pembangunan ekonomi sebenar.
Pada persidangan Create tahun lepas, Robin Li meramalkan: "Memandangkan ambang untuk aplikasi teknologi terus menurun, pencipta akan menyambut 10 tahun keemasan kecerdasan buatan." Fikirkan begitu.
Pada tahun 2020, apabila Robin Li baru memulakan perniagaannya, dia menghadapi pecahnya gelembung Internet, dan nilai pasaran dunia menyejat sebanyak 8 trilion . Seterusnya, Internet memasuki dekad keemasan, kecerdasan buatan juga akan mengalami pasang surut yang sama.
Baidu akan, seperti biasa, memupuk bakat AI untuk masyarakat dan industri, melabur lebih banyak sumber dan bekerjasama dengan pembangun untuk melakukan yang terbaik untuk pembangunan AI di China.
Pada akhir persidangan Create, ahli kumpulan maya muncul semula.
Vokalis/gitar: Xi Jiajia, pemain dram: Du Xiaoxiao, bes: Ye Youyou, papan kekunci: Lin Kaikai
Xi Jiajia berkata bahawa dia sangat gembira kerana lukisannya dapat dipamerkan pada pembukaan persidangan itu!
Dan Lin Kaikai telah mengatasi ketagihannya untuk menjadi penerbit. Dia dengan gembira berbangga bahawa dia cukup berbakat dalam mengatur~
Ye Youyou berkata. bahawa reka bentuknya sebenarnya menangkap titik estetik semua orang, yang membuatnya cukup berpuas hati. Jadi, aspek reka bentuk manakah yang menjadi tanggungjawabnya?
Du Xiaoxiao meneka dengan betul: ia adalah pautan "Zhiyi" dan "Qianliu".
Dan Du Xiaoxiao berkata bahawa dia telah pun menulis draf siaran akhbar.
Semasa brainstorming bersama empat ahli, tajuk manuskrip keluar - "Syok!" Ini adalah persidangan antara manusia dan mesin."
Atas ialah kandungan terperinci Robin Li membelanjakan lebih daripada 100 bilion dalam 10 tahun! 5 juta pembangun menyokong rangka kerja pembelajaran mendalam terbesar di China. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!