Jadual Kandungan
Jangan berhenti pada eksperimen: fokus juga pada pelaksanaan dan sumber terbuka hasil
AI Dipercayai: Penyelidikan tentang kebolehjelasan dan keteguhan masih perlu diterokai
Fokus Kesukaran: Kaedah statistik tidak dapat memahami semantik secara asas
Penyelidikan dan pelaksanaan: bagaimana untuk mengimbangi kedua-duanya?
Mencari Jade of Kunshan: Penyelidik memerlukan tahap kebebasan tertentu
Jawatan AI Makmal: Pemilihan calon lebih memberi perhatian kepada "tiga perkara baik" dan hati cukup kuat
Pengenalan tetamu
Rumah Peranti teknologi AI T Frontline |. Temu bual eksklusif dengan Tencent AILab: Dari 'titik' kepada 'garisan', makmal adalah lebih daripada sekadar eksperimen

T Frontline |. Temu bual eksklusif dengan Tencent AILab: Dari 'titik' kepada 'garisan', makmal adalah lebih daripada sekadar eksperimen

Apr 09, 2023 am 09:51 AM
AI pembelajaran mesin ai

Tetamu: Shi Shuming

Penulis: Mo Qi

Pengulas: Yun Zhao

“Kebanyakan kerja penyelidikan cenderung berkisar pada satu titik, dan seperti titik Hasilnya sukar untuk digunakan secara langsung oleh pengguna," kata Shi Shuming, pengarah Pusat Pemprosesan Bahasa Asli Tencent AI Lab.

Dalam sedekad yang lalu atau lebih, kecerdasan buatan (AI) telah mengalami kebangkitan, dan kemajuan teknologi yang ketara juga telah berlaku dalam bidang pemprosesan bahasa semula jadi (NLP). Kemajuan teknologi NLP telah meningkatkan kualiti terjemahan mesin, menjadikan carian dan pengesyoran lebih tepat, dan juga melahirkan lebih banyak aplikasi senario digital, seperti robot perbualan, penulisan pintar, dsb. Jadi, sebagai permata mahkota AI, bidang NLP telah menarik banyak syarikat domestik dan asing, bakat dan modal Bagaimanakah pelbagai faktor menggalakkan kemajuan penyelidikannya? Bagaimanakah syarikat mengeram dan melaksanakan hasil penyelidikan? Bagaimanakah pengamal yang berkaitan melihat kesesakan dan kontroversi dalam pembangunan AI?

Baru-baru ini, "T Frontline" mendapat penghormatan untuk menemu bual Pusat Pemprosesan Bahasa Semula Jadi Tencent AI Lab, dengan harapan dapat melihatnya dari perspektif "makmal kecerdasan buatan".

Jangan berhenti pada eksperimen: fokus juga pada pelaksanaan dan sumber terbuka hasil

T barisan hadapan: Tencent AILab makmal dalam bahasa semula jadi Dari segi pemprosesan, apakah arah yang perlu diterokai?

Shi Shuming: Pasukan pemprosesan bahasa semula jadi Tencent AI Lab menjalankan penyelidikan dalam empat arah: pemahaman teks, penjanaan teks, dialog pintar dan terjemahan mesin. Dari segi keputusan, dilihat dari situasi penerbitan kertas, dalam tempoh tiga tahun yang lalu, pasukan itu telah menerbitkan lebih daripada 50 kertas kerja akademik dalam persidangan dan jurnal antarabangsa kelas pertama setiap tahun, kedudukan antara institusi penyelidikan domestik yang terbaik; bahawa dua kertas kerja kami telah dinilai secara berasingan Untuk kertas terbaik NAACL'2021 dan kertas cemerlang ACL'2021. Dari segi pertandingan akademik, kami telah memenangi banyak pertandingan heavyweight Contohnya, kami memenangi tempat pertama dalam 5 tugasan dalam Pertandingan Terjemahan Mesin Antarabangsa WMT'2021 tahun lepas.

Selain kertas kerja dan pertandingan akademik, kami juga secara sedar mengubah hasil penyelidikan kami kepada sistem dan data sumber terbuka, terbuka kepada pengguna di dalam dan di luar syarikat. Sistem dan data ini termasuk sistem pemahaman teks TexSmart, sistem terjemahan interaktif TranSmart, pembantu kreatif pintar "Effidit", data vektor perkataan Cina yang mengandungi 8 juta perkataan, dsb.

Data vektor perkataan Cina yang dikeluarkan pada penghujung tahun 2018 dipanggil "Vektor perkataan Tencent" oleh dunia luar Ia berada pada tahap terkemuka dari segi skala, ketepatan dan kesegaran, dan telah mendapat perhatian meluas , perbincangan dan penggunaan dalam industri Meningkatkan prestasi secara berterusan dalam aplikasi. Berbanding dengan sistem yang serupa, sistem pemahaman teks TexSmart menyediakan pengecaman entiti bernama (NER), perkaitan semantik, ungkapan semantik mendalam, pemetaan teks dan fungsi khas lain, dan memenangi anugerah terbaik di Persidangan Linguistik Pengiraan China (CCL' ke-19). 2020) Anugerah Demonstrasi Sistem. Sistem terjemahan interaktif TranSmart ialah produk Internet terjemahan interaktif awam pertama di China Ia menyediakan fungsi kemuncak seperti kaedah input terjemahan, penyahkodan kekangan dan gabungan memori terjemahan. Ia menyokong banyak pelanggan, perniagaan dan senario di dalam dan di luar syarikat, termasuk Agensi Dokumentasi Pertubuhan Bangsa-Bangsa Bersatu, Memsource, Huatai Securities, Tencent Music, China Literature Online, Tencent Games Going Global, Tencent Optional Stock Translation Document, dsb. Pembantu kreatif pintar "Effidit" yang kami keluarkan beberapa waktu lalu menyediakan pelengkapan teks berbilang dimensi, penggilap teks terpelbagai dan fungsi khas lain Ia menggunakan teknologi AI untuk membantu penulis mencapah idea, memperkayakan ekspresi dan meningkatkan kecekapan penyuntingan dan penulisan.

T Frontline: Dari segi kerjasama pintar, bolehkah anda mengambil "Effidit" sebagai contoh dan bercakap tentang asal usul dan status terkini projek?

Shi Shuming: Projek Effidit pembantu penulisan pintar telah dilancarkan sebelum Hari Kebangsaan pada 2020. Terdapat dua sebab utama untuk melakukan projek ini: pertama, terdapat titik kesakitan secara bertulis, dan kedua, teknologi NLP yang diperlukan untuk senario ini adalah konsisten dengan pengumpulan keupayaan pasukan kami.

Pertama sekali, mari kita bercakap tentang perkara yang menyakitkan dalam penulisan: dalam kehidupan dan pekerjaan, kita sering perlu membaca berita, novel, artikel akaun awam, kertas kerja, laporan teknikal, dll., dan kita juga perlu tulis beberapa perkara, seperti dokumen teknikal dan minit mesyuarat , bahan pelaporan, dsb. Kita boleh mendapati bahawa proses membaca biasanya santai, menyenangkan dan tidak bersusah payah, tetapi menulis adalah berbeza Kita sering tidak tahu cara menggunakan perkataan yang sesuai untuk menyatakan fikiran kita Kadang-kadang ayat dan perenggan yang ditulis dengan usaha yang besar masih sama . Nampak kering dan terdedah kepada typo di bahagian tengah. Mungkin kebanyakan orang lebih pandai membaca daripada menulis. Oleh itu, kami memikirkan sama ada kami boleh menggunakan teknologi untuk menyelesaikan masalah dalam penulisan dan meningkatkan kecekapan penulisan?

Mari kita bincangkan tentang sebab kedua untuk memulakan projek ini: Kami telah memikirkan tentang bagaimana teknologi NLP boleh meningkatkan kecekapan kerja manusia dan kualiti hidup? Dalam beberapa tahun yang lalu, kami telah menjalankan kerja penyelidikan yang mendalam dalam sub-arah NLP seperti pemahaman teks, penjanaan teks dan terjemahan mesin. Kebanyakan kerja penyelidikan selalunya dijalankan di sekitar satu titik, dan hasil seperti titik sukar untuk digunakan secara langsung oleh pengguna. Oleh itu, secara tidak sedar kita menyusun beberapa hasil penyelidikan seperti titik untuk membentuk garis, iaitu sistem. Kami telah mencari senario pelaksanaan untuk hasil penyelidikan dalam penjanaan teks. Memandangkan perkara sakit dalam penulisan yang dinyatakan sebelum ini, kami memutuskan untuk melancarkan projek Effidit pembantu penulisan pintar selepas perbincangan.

Selepas satu setengah tahun penyelidikan dan pembangunan, versi pertama telah dikeluarkan. Seterusnya, kami akan terus mengulang dan mengoptimumkan, mendengar maklum balas pengguna, meningkatkan keberkesanan pelbagai fungsi, dan berusaha untuk menghasilkan alat yang mudah digunakan dan popular dengan pengguna.

AI Dipercayai: Penyelidikan tentang kebolehjelasan dan keteguhan masih perlu diterokai

T Frontline: Dalam beberapa tahun kebelakangan ini, AI yang dipercayai telah menarik perhatian orang dalam industri Can you Can anda bercakap tentang pemahaman dan kemajuan AI yang boleh dipercayai dalam bidang NLP?

Shi Shuming: Saya tidak tahu banyak tentang AI yang boleh dipercayai dan hanya boleh bercakap tentang beberapa pemikiran cetek. AI yang boleh dipercayai ialah konsep abstrak dan pada masa ini tiada definisi yang tepat. Walau bagaimanapun, dari perspektif teknikal, ia merangkumi banyak elemen: kebolehtafsiran model, keteguhan, keadilan dan perlindungan privasi, dsb. Dalam beberapa tahun kebelakangan ini, model bahasa pra-latihan berdasarkan struktur Transformer telah menunjukkan hasil yang menakjubkan pada banyak tugas pemprosesan bahasa semula jadi dan telah menarik perhatian meluas. Walau bagaimanapun, model AI jenis ini pada asasnya ialah model kotak hitam dipacu data Kebolehtafsiran hasil ramalan mereka adalah lemah, keteguhan model tidak begitu baik dan mereka cenderung untuk mempelajari bias yang wujud dalam data (seperti jantina). Bias), mengakibatkan beberapa masalah dalam keadilan model. Vektor perkataan yang muncul lebih awal daripada model bahasa pra-latihan juga mengalami kecenderungan jantina. Pada masa ini, dalam satu pihak, membina model AI yang boleh dipercayai adalah hala tuju penyelidikan yang menarik perhatian dalam bidang pembelajaran mesin dan NLP Terdapat banyak kerja penyelidikan dan beberapa kemajuan telah dicapai. Sebaliknya, kemajuan ini masih jauh dari matlamat Sebagai contoh, dari segi kebolehtafsiran model yang mendalam, kemajuannya tidak begitu hebat dan langkah utama belum diambil.

Tencent AI Lab tempat saya bekerja juga sedang menjalankan beberapa kerja penyelidikan tentang AI yang dipercayai. Tencent AI Lab terus melabur dalam kerja AI yang boleh dipercayai sejak 2018, dan telah mencapai beberapa keputusan dalam tiga hala utama: keteguhan lawan, pembelajaran pemindahan teragih dan kebolehtafsiran. Pada masa hadapan, Tencent AI Lab akan menumpukan pada keadilan dan kebolehjelasan AI, dan terus meneroka aplikasi teknologi berkaitan dalam bidang perubatan, farmaseutikal, sains hayat dan lain-lain.

Fokus Kesukaran: Kaedah statistik tidak dapat memahami semantik secara asas

T Frontline: Pada pendapat anda, apakah kesesakan semasa Penyelidikan NLP di mana? Apakah hala tuju masa depan?

Shi Shuming: Sejak kemunculan bidang penyelidikan pemprosesan bahasa semula jadi, kesesakan terbesar yang dihadapinya ialah bagaimana untuk benar-benar memahami semantik yang dinyatakan oleh sekeping teks bahasa semula jadi. Kemacetan ini tidak dipecahkan setakat ini.

Manusia benar-benar mempunyai kebolehan untuk memahami bahasa semula jadi Contohnya, apabila kita melihat ayat "Dia suka biru", kita tahu maksudnya, apa itu "seperti" dan apa itu "biru". Bagi algoritma NLP, apabila ia memproses ayat di atas, tidak ada perbezaan penting daripada ayat "abc def xyz" yang kita lihat dalam bahasa asing yang tidak diketahui. Katakan dalam bahasa asing yang tidak diketahui ini, "abc" bermaksud "dia", "def" bermaksud seperti, dan "xyz" bermaksud "hijau". Apabila kita tidak tahu apa-apa tentang bahasa asing ini, kita tidak dapat memahami sebarang ayat dalam bahasa asing ini. Jika kita bernasib baik untuk melihat sejumlah besar ayat yang ditulis dalam bahasa asing ini, kita mungkin melakukan beberapa analisis statistik ke atasnya, cuba untuk mewujudkan kesesuaian antara perkataan dalam bahasa asing ini dan perkataan dalam bahasa ibunda kita, dengan harapan akhirnya memecahkan bahasa. Proses ini tidak mudah dan tiada jaminan kejayaan muktamad.

Bagi AI, situasi yang dihadapinya lebih teruk daripada kita manusia yang mentafsir bahasa asing yang tidak diketahui. Kami mempunyai kewarasan hidup dan pemetaan perkataan asli kepada konsep dalaman dalam fikiran kami, tetapi AI tidak mempunyai perkara ini. Kaedah simbolik dalam penyelidikan NLP cuba menambah keupayaan seperti manusia kepada AI melalui ekspresi simbolik teks dan graf pengetahuan, cuba menyelesaikan masalah pemahaman secara asas manakala kaedah statistik mengabaikan akal sehat dan konsep dalaman minda dsb., menumpukan pada penambahbaikan kaedah statistik dan menggunakan sepenuhnya maklumat dalam data itu sendiri. Setakat ini, kaedah kedua adalah arus perdana penyelidikan industri dan telah mencapai kejayaan yang lebih besar.

Berdasarkan penemuan kesesakan dan kemajuan NLP statistik dalam dekad yang lalu, teknologi vektor perkataan (iaitu, menggunakan vektor padat dimensi sederhana untuk mewakili perkataan) Ia menerobos kesesakan perkataan yang boleh dihitung, digabungkan dengan algoritma pembelajaran mendalam dan kuasa pengkomputeran GPU, dan memulakan satu siri kejayaan dalam NLP dalam dekad yang lalu. Kemunculan struktur rangkaian baharu (seperti Transformer) dan paradigma (seperti pra-latihan) telah banyak meningkatkan kebolehkiraan teks dan kesan perwakilan teks. Walau bagaimanapun, kerana NLP statistik tidak memodelkan konsep akal dan asas seperti yang dilakukan manusia, dan tidak dapat memahami bahasa semula jadi secara asas, adalah sukar untuk mengelakkan beberapa kesilapan akal.

Sudah tentu, komuniti penyelidik tidak pernah berputus asa dalam perlambangan dan perwakilan semantik yang mendalam Percubaan paling berpengaruh dalam bidang ini dalam sepuluh tahun yang lalu termasuk Wolfram Alpha dan AMR (Perwakilan Makna Abstrak). Jalan ini sangat sukar, dan cabaran utama ialah pemodelan sejumlah besar konsep abstrak dan kebolehskalaan (iaitu, daripada memahami ayat yang sangat formal kepada memahami teks bahasa semula jadi umum).

Arah tuju penyelidikan masa depan yang mungkin dalam teknologi asas termasuk: model bahasa generasi baharu, penjanaan teks boleh dikawal, meningkatkan keupayaan pemindahan merentas domain model, model statistik yang menyepadukan pengetahuan secara berkesan, perwakilan semantik yang mendalam, dsb. Arah penyelidikan ini sepadan dengan beberapa kesesakan tempatan dalam penyelidikan NLP. Hala tuju yang perlu diterokai dari segi aplikasi ialah cara menggunakan teknologi NLP untuk meningkatkan kecekapan kerja manusia dan kualiti hidup.

Penyelidikan dan pelaksanaan: bagaimana untuk mengimbangi kedua-duanya?

T Frontline: Bagaimanakah hala tuju AI ​​Lab NLP diterokai dan dibentangkan dari segi penyelidikan asas, teknologi canggih dan perindustrian? Apakah langkah seterusnya?

Shi Shuming: Dari segi penyelidikan asas, matlamat kami adalah untuk mencari kejayaan dalam penyelidikan asas, menyelesaikan beberapa kesesakan dalam penyelidikan semasa dan berusaha untuk menghasilkan produk asli dan berguna seperti Word2vec, Transformer dan Bert . , keputusan dengan impak yang ketara. Untuk mencapai matlamat ini, di satu pihak, kami memberi penyelidik asas tahap kebebasan yang lebih besar dan menggalakkan mereka melakukan perkara dengan potensi kesan jangka panjang sebaliknya, seluruh ahli pasukan menggunakan sumbang saran dan kaedah lain untuk memilih beberapa arahan terobosan utama, mari kita bekerjasama.

Dari segi perindustrian, sebagai tambahan kepada transformasi teknologi produk sedia ada syarikat, kami memberi tumpuan kepada mencipta satu atau dua produk teknologi yang diterajui oleh kami sendiri Matlamatnya adalah untuk mengintegrasikan hasil penyelidikan dan meningkatkan kecekapan kerja orang ramai atau kualiti hidup. Produk teknologi ini termasuk TranSmart, sistem terjemahan interaktif untuk penterjemah dan Effidit, pembantu kreatif pintar untuk senario penyuntingan teks dan penulisan. Kami akan terus menggilap kedua-dua produk teknikal ini.

Mencari Jade of Kunshan: Penyelidik memerlukan tahap kebebasan tertentu

T Frontline: Dari segi jabatan penyelidikan saintifik, pada pendapat anda apakah fokus penyelidik yang berbeza dan jurutera algoritma?

Shi Shuming: Dalam pasukan kami, tanggungjawab jurutera algoritma termasuk dua perkara: satu adalah untuk melaksanakan atau mengoptimumkan algoritma sedia ada (seperti algoritma dalam kertas yang diterbitkan), dan satu lagi adalah untuk melaksanakan dan menggilapnya produk teknologi. Sebagai tambahan kepada dua tanggungjawab jurutera algoritma, tanggungjawab penyelidik juga termasuk mencadangkan dan menerbitkan hasil penyelidikan asal. Bahagian ini tidak mutlak, dan sempadannya agak kabur Ia sebahagian besarnya bergantung kepada kepentingan peribadi pekerja dan keperluan projek.

T Barisan Hadapan: Sebagai pengurus, apakah perbezaan antara pengurusan pasukan makmal dan kaedah dan konsep pengurusan jurutera teknikal tradisional?

Shi Shuming: Bagi pasukan perniagaan, jurutera teknikal perlu bekerjasama rapat untuk mencipta produk yang dirancang melalui proses pengurusan projek tertentu. Pasukan makmal cenderung terdiri daripada penyelidik asas dan jurutera teknikal (dan mungkin sejumlah kecil kakitangan produk dan operasi). Untuk penyelidikan asas, penyelidik perlu diberi kebebasan yang lebih besar, kurang "bimbingan" dan lebih banyak bantuan, menghormati minat mereka, merangsang potensi mereka, dan menggalakkan mereka melakukan sesuatu dengan potensi kesan jangka panjang. Kejayaan dalam penyelidikan asas selalunya tidak dirancang dari atas ke bawah atau diuruskan melalui proses pengurusan projek. Sebaliknya, apabila pasukan makmal membina produk teknikal, ia memerlukan lebih banyak kerjasama antara penyelidik dan jurutera teknikal, ditambah dengan proses pengurusan projek yang ringan.

Jawatan AI Makmal: Pemilihan calon lebih memberi perhatian kepada "tiga perkara baik" dan hati cukup kuat

T barisan hadapan: Jika ada pemohon, keupayaan penyelidikan adalah sangat kuat, dan dia telah banyak menerbitkan di persidangan peringkat tinggi Saya mempunyai tesis, tetapi keupayaan kejuruteraan saya lemah Adakah anda akan menerimanya?

Shi Shuming: Ini soalan yang bagus Ini adalah soalan yang sering kita hadapi semasa merekrut. Sebaik-baiknya, kedua-dua ahli akademik dan industri ingin memupuk atau merekrut bakat yang mempunyai keupayaan penyelidikan dan kejuruteraan yang kukuh Walau bagaimanapun, dalam amalan, orang seperti itu jarang berlaku dan sering menjadi objek persaingan di kalangan pelbagai syarikat dan institusi penyelidikan. Semasa proses temu duga, bagi calon yang mempunyai kebolehan penyelidikan yang cemerlang, keperluan keupayaan kejuruteraan kami akan dikurangkan dengan sewajarnya, tetapi mestilah lebih tinggi daripada ambang asas. Begitu juga, bagi calon yang mempunyai kebolehan kejuruteraan yang kuat, keperluan kami untuk kebolehan penyelidikan juga akan lebih rendah. Dalam proses kerja sebenar, jika disusun dengan betul, pekerja yang mempunyai keupayaan penyelidikan yang kukuh dan keupayaan kejuruteraan yang kukuh akan memberikan permainan sepenuhnya kepada kelebihan masing-masing melalui kerjasama dan menyelesaikan projek bersama-sama.

T Barisan Hadapan: Apakah kebolehan yang paling anda hargai dalam diri calon?

Shi Shuming: Dr. Shen Xiangyang berkata bahawa keperluan untuk merekrut orang adalah "tiga baik": baik dalam matematik, baik dalam pengaturcaraan dan sikap yang baik. Menjadi baik dalam matematik sepadan dengan potensi penyelidikan seseorang, mahir dalam pengaturcaraan sepadan dengan keupayaan kejuruteraan, dan mempunyai sikap yang baik termasuk "bersemangat dengan kerja seseorang," "dapat bekerjasama dengan rakan sekerja untuk keputusan menang-menang," dan " boleh dipercayai dalam melakukan sesuatu." Tiga perkara ini dinilai oleh banyak institusi penyelidikan. Semasa proses temuduga sebenar, keupayaan dan potensi penyelidikan calon sering dinilai dengan membaca rekod penerbitan kertas dan berbual tentang projek, keupayaan kejuruteraan calon dinilai melalui ujian pengaturcaraan dan output projek, dan keseluruhan proses temuduga digunakan untuk membuat kesimpulan sama ada calon adalah tulen. Kaedah spekulasi dan penilaian ini kadangkala boleh membuat kesilapan, tetapi secara keseluruhan ketepatannya agak tinggi.

Terdapat juga beberapa kebolehan yang sukar dinilai melalui temuduga satu atau dua jam, tetapi jika pekerja yang diambil mempunyai kebolehan ini, ia adalah harta karun. Yang pertama ialah keupayaan untuk memilih topik penyelidikan yang penting. Kedua ialah keupayaan untuk menyelesaikan satu perkara. Orang atau pasukan yang kekurangan keupayaan ini mungkin sentiasa kerap memulakan pelbagai topik atau projek, tetapi topik dan projek ini tidak pernah disiapkan dengan kualiti yang tinggi, dan selalunya berakhir dengan cara antiklimaks. Ini mungkin ada kaitan dengan pelaksanaan, ketabahan, fokus, tahap teknikal, dsb. Yang ketiga ialah keupayaan untuk menahan kesepian dan kritikan. Perkara-perkara penting dan berpengaruh sering tidak difahami oleh kebanyakan orang sebelum pengaruh mereka keluar; jika hati anda tidak cukup kuat dan tidak dapat menahan kesepian dan kritikan, ia mungkin sukar untuk bertahan, dan ia akan mudah untuk melepaskan niat asal anda dan melompat ke dalam apa yang sudah menjadi lautan merah untuk melibatkan titik panas semasa.

T Barisan Hadapan: Apakah cadangan yang anda ada pada masa ini untuk graduan baru dan orang teknikal yang telah bertukar kerjaya untuk memasuki bidang kecerdasan buatan?

Shi Shuming: Kelayakan akademik setiap graduan, penyertaan sekolah dan projek adalah berbeza. Saya hanya boleh memikirkan beberapa perkara buat masa ini: Pertama, jangan hanya melibatkan diri dalam melakukan sesuatu dan mengabaikan pengumpulan maklumat dan kecerdasan. Cari rakan pelajar atau rakan yang lebih senior untuk bertanya tentang situasi itu, mendengar pengenalan mereka kepada situasi kerja semasa mereka dan penilaian mereka terhadap pelbagai jenis kerja dan pelbagai unit kerja, dan memahami laluan yang telah mereka lalui dan kesulitan yang mereka hadapi. Pada masa yang sama, maklumat dikumpul melalui pelbagai kaedah seperti forum, akaun awam, video pendek, dan lain-lain untuk membantu seseorang membuat keputusan di nod kritikal dalam kehidupan ini. Kedua, jika anda berada lebih daripada setahun untuk tamat pengajian dan tidak mempunyai pengalaman magang, cari tempat yang boleh dipercayai untuk melakukan amali. Melalui latihan amali, di satu pihak, anda boleh mengumpul pengalaman praktikal, meningkatkan kebolehan anda, dan mengalami perasaan bekerja lebih awal sebaliknya, pengalaman latihan juga akan memperkayakan resume anda dan meningkatkan daya saing anda apabila mencari pekerjaan. Ketiga, involusi sentiasa tidak dapat dielakkan di tempat kerja, dan semuanya berjalan seperti yang dirancang Kawal jangkaan, laraskan mentaliti anda, dan cari cara untuk mencerna jurang emosi yang disebabkan oleh perubahan. Keempat, selepas menetap, jangan lupa impian anda, bekerja keras, dan mencapai sesuatu yang sesuai dengan kemampuan anda.

Saya berharap setiap graduan dapat mencari pekerjaan kegemaran mereka dan berkembang di tempat kerja mereka, dan saya berharap setiap juruteknik yang menukar kerjaya dan memasuki bidang kecerdasan buatan dapat menikmati kebahagiaan yang dibawa oleh perjuangan dalam landasan baharu AI. dan menuai.

Pengenalan tetamu

Shi Shuming, lulusan Jabatan Sains Komputer Universiti Tsinghua, kini merupakan pengarah Pusat Pemprosesan Bahasa Semulajadi Tencent AI Lab. Minat penyelidikannya termasuk perlombongan pengetahuan, pemahaman bahasa semula jadi, penjanaan teks, dan dialog pintar. Beliau telah menerbitkan lebih daripada 100 kertas kerja dalam persidangan akademik dan jurnal seperti ACL, EMNLP, AAAI, IJCAI, WWW, SIGIR, TACL, dll., dengan indeks H 35. Beliau telah berkhidmat sebagai pengerusi bersama demonstrasi sistem EMNLP 2021 dan CIKM 2013, ahli jawatankuasa program kanan KDD2022, dan ahli jawatankuasa program ACL, EMNLP dan persidangan lain.


Atas ialah kandungan terperinci T Frontline |. Temu bual eksklusif dengan Tencent AILab: Dari 'titik' kepada 'garisan', makmal adalah lebih daripada sekadar eksperimen. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

AI Hentai Generator

Menjana ai hentai secara percuma.

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Tetapan grafik terbaik
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Cara Membuka Segala -galanya Di Myrise
1 bulan yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Cara Melaksanakan Penyortiran Fail oleh Debian Readdir Cara Melaksanakan Penyortiran Fail oleh Debian Readdir Apr 13, 2025 am 09:06 AM

Dalam sistem Debian, fungsi Readdir digunakan untuk membaca kandungan direktori, tetapi urutan yang dikembalikannya tidak ditentukan sebelumnya. Untuk menyusun fail dalam direktori, anda perlu membaca semua fail terlebih dahulu, dan kemudian menyusunnya menggunakan fungsi QSORT. Kod berikut menunjukkan cara menyusun fail direktori menggunakan ReadDir dan QSORT dalam sistem Debian:#termasuk#termasuk#termasuk#termasuk // fungsi perbandingan adat, yang digunakan untuk qSortintCompare (Constvoid*A, Constvoid*b) {Returnstrcmp (*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(*(

Cara Mengoptimumkan Prestasi Debian Readdir Cara Mengoptimumkan Prestasi Debian Readdir Apr 13, 2025 am 08:48 AM

Dalam sistem Debian, panggilan sistem Readdir digunakan untuk membaca kandungan direktori. Jika prestasinya tidak baik, cuba strategi pengoptimuman berikut: Memudahkan bilangan fail direktori: Split direktori besar ke dalam pelbagai direktori kecil sebanyak mungkin, mengurangkan bilangan item yang diproses setiap panggilan readdir. Dayakan Caching Kandungan Direktori: Bina mekanisme cache, kemas kini cache secara teratur atau apabila kandungan direktori berubah, dan mengurangkan panggilan kerap ke Readdir. Cafh memori (seperti memcached atau redis) atau cache tempatan (seperti fail atau pangkalan data) boleh dipertimbangkan. Mengamalkan struktur data yang cekap: Sekiranya anda melaksanakan traversal direktori sendiri, pilih struktur data yang lebih cekap (seperti jadual hash dan bukannya carian linear) untuk menyimpan dan mengakses maklumat direktori

Cara Menetapkan Tahap Log Debian Apache Cara Menetapkan Tahap Log Debian Apache Apr 13, 2025 am 08:33 AM

Artikel ini menerangkan cara menyesuaikan tahap pembalakan pelayan Apacheweb dalam sistem Debian. Dengan mengubah suai fail konfigurasi, anda boleh mengawal tahap maklumat log yang direkodkan oleh Apache. Kaedah 1: Ubah suai fail konfigurasi utama untuk mencari fail konfigurasi: Fail konfigurasi apache2.x biasanya terletak di direktori/etc/apache2/direktori. Nama fail mungkin apache2.conf atau httpd.conf, bergantung pada kaedah pemasangan anda. Edit Fail Konfigurasi: Buka Fail Konfigurasi dengan Kebenaran Root Menggunakan Editor Teks (seperti Nano): Sudonano/ETC/APACHE2/APACHE2.CONF

Bagaimana Debian OpenSSL Menghalang Serangan Man-dalam-Middle Bagaimana Debian OpenSSL Menghalang Serangan Man-dalam-Middle Apr 13, 2025 am 10:30 AM

Dalam sistem Debian, OpenSSL adalah perpustakaan penting untuk pengurusan penyulitan, penyahsulitan dan sijil. Untuk mengelakkan serangan lelaki-dalam-pertengahan (MITM), langkah-langkah berikut boleh diambil: Gunakan HTTPS: Pastikan semua permintaan rangkaian menggunakan protokol HTTPS dan bukannya HTTP. HTTPS menggunakan TLS (Protokol Keselamatan Lapisan Pengangkutan) untuk menyulitkan data komunikasi untuk memastikan data tidak dicuri atau diganggu semasa penghantaran. Sahkan Sijil Pelayan: Sahkan secara manual Sijil Pelayan pada klien untuk memastikan ia boleh dipercayai. Pelayan boleh disahkan secara manual melalui kaedah perwakilan urlSession

Kaedah pemasangan sijil SSL Server Server Debian Kaedah pemasangan sijil SSL Server Server Debian Apr 13, 2025 am 11:39 AM

Langkah -langkah untuk memasang sijil SSL pada pelayan mel Debian adalah seperti berikut: 1. Pasang OpenSSL Toolkit terlebih dahulu, pastikan bahawa OpenSSL Toolkit telah dipasang pada sistem anda. Jika tidak dipasang, anda boleh menggunakan arahan berikut untuk memasang: sudoapt-getupdateudoapt-getinstallopenssl2. Menjana permintaan kunci dan sijil peribadi seterusnya, gunakan OpenSSL untuk menjana kunci peribadi RSA 2048-bit dan permintaan sijil (CSR): Membuka

Bagaimana Debian Readdir Bersepadu Dengan Alat Lain Bagaimana Debian Readdir Bersepadu Dengan Alat Lain Apr 13, 2025 am 09:42 AM

Fungsi Readdir dalam sistem Debian adalah panggilan sistem yang digunakan untuk membaca kandungan direktori dan sering digunakan dalam pengaturcaraan C. Artikel ini akan menerangkan cara mengintegrasikan Readdir dengan alat lain untuk meningkatkan fungsinya. Kaedah 1: Menggabungkan Program Bahasa C dan Pipeline Pertama, tulis program C untuk memanggil fungsi Readdir dan output hasilnya:#termasuk#termasuk#includeintMain (intargc, char*argv []) {dir*dir; structdirent*entry; if (argc! = 2) {

Petua Konfigurasi Firewall Pelayan Mel Debian Petua Konfigurasi Firewall Pelayan Mel Debian Apr 13, 2025 am 11:42 AM

Mengkonfigurasi firewall pelayan Mail Debian adalah langkah penting dalam memastikan keselamatan pelayan. Berikut adalah beberapa kaedah konfigurasi firewall yang biasa digunakan, termasuk penggunaan iptables dan firewalld. Gunakan iptables untuk mengkonfigurasi firewall untuk memasang iptables (jika belum dipasang): sudoapt-getupdateudoapt-getinstalliplesview peraturan iptables semasa: konfigurasi sudoiptable-l

Cara Belajar Debian Syslog Cara Belajar Debian Syslog Apr 13, 2025 am 11:51 AM

Panduan ini akan membimbing anda untuk belajar cara menggunakan syslog dalam sistem Debian. SYSLOG adalah perkhidmatan utama dalam sistem Linux untuk sistem pembalakan dan mesej log aplikasi. Ia membantu pentadbir memantau dan menganalisis aktiviti sistem untuk mengenal pasti dan menyelesaikan masalah dengan cepat. 1. Pengetahuan asas syslog Fungsi teras syslog termasuk: mengumpul dan menguruskan mesej log secara terpusat; menyokong pelbagai format output log dan lokasi sasaran (seperti fail atau rangkaian); Menyediakan fungsi tontonan log dan penapisan masa nyata. 2. Pasang dan konfigurasikan syslog (menggunakan rsyslog) Sistem Debian menggunakan rsyslog secara lalai. Anda boleh memasangnya dengan arahan berikut: sudoaptupdatesud

See all articles