① Kandungan semua lajur tab di bawah pengesyoran halaman utama, produk aliran maklumat secara amnya Tab pertama mempunyai bahagian lalu lintas yang lebih tinggi
② Aliran maklumat yang meluncur ke bawah daripada carian hangat ini juga , termasuk tab aliran maklumat lain ini pada halaman, seperti saluran video, dll.;
③ Cari atau klik video yang disyorkan dalam keseluruhan APP untuk memasuki adegan video yang mengasyikkan.
Perniagaan kami mempunyai ciri-ciri berikut:
(1) Pertama
Pertama, dari perspektif pelaksanaan yang disyorkan: ① Terdapat banyak senario perniagaan.
② Pengguna di UI Weibo mempunyai pelbagai operasi dan maklum balas Kandungan boleh dilihat dengan mengklik pada halaman teks atau digunakan dalam strim pelbagai. Contohnya, klik untuk masuk ke halaman peribadi blogger, klik untuk masuk ke halaman teks, klik pada gambar, klik pada video, ke hadapan komen dan suka, dll.
③ Terdapat banyak jenis bahan yang boleh diedarkan, seperti gambar panjang, gambar (satu gambar atau beberapa gambar), dan video (mendatar atau menegak ) yang boleh diedarkan pada video halaman utama), artikel, dsb.
(2) Dari perspektif kedudukan produk:
① Perkhidmatan tempat panas : Perubahan trafik Weibo sangat besar sebelum dan selepas titik panas berlaku. Pengguna boleh menggunakan kandungan panas dalam pengesyoran, yang merupakan keperluan syarikat untuk produk yang disyorkan.
② Bina perhubungan: Saya berharap dapat mengumpul beberapa perhubungan sosial dalam Weibo yang disyorkan.
2. Pemilihan Teknologi
Dari segi rangka kerja pengesyoran semasa, ratusan bilion ciri dan trilion parameter adalah standard. Berbeza daripada NLP dan CV, model yang terlalu besar dalam kedua-dua arah ini mempunyai kerumitan tinggi rangkaian itu sendiri, kesederhanaan yang baik dalam senario yang disyorkan, saiz model yang agak besar, dan latihan sering menggunakan keselarian data, dan setiap pengguna tidak perlu menyediakan Semua model parameter.
Evolusi teknologi pasukan kami dari 2018 hingga 2022 terutamanya dalam dua aspek: berskala besar dan masa nyata. Atas dasar ini, buat struktur kompleks untuk mencapai hasil dua kali ganda dengan separuh usaha.
Berikut ialah pengenalan ringkas kepada platform pembelajaran dalam talian Weidl kami.
Proses utama ialah: Sampel penyambungan tingkah laku pengguna digunakan untuk pembelajaran mengikut model, dan kemudian pengesyoran diberikan kepada pengguna untuk mendapatkan maklum balas secara keseluruhan reka bentuk menggunakan prinsip keutamaan aliran data untuk mencapai fleksibiliti yang lebih baik. Tidak kira kaedah yang digunakan untuk melatih KERNEL, bahagian kemas kini masa nyata antara storan model luar talian dan PS dalam talian masih wujud. Sama ada model latihan LR atau FM tulisan tangan, Tensorflow, atau DeepRec, adalah mungkin Storan model yang sepadan ialah satu set aliran data yang dibina oleh kami sendiri, dan format model juga dibuat oleh kami sendiri, dengan itu memastikan berbilang itu. Bahagian belakang boleh dimuat turun daripada Latihan model boleh dikemas kini dalam talian dalam masa kurang daripada satu minit dan parameter baharu boleh digunakan pada kali seterusnya pengguna memanggilnya. Di bawah prinsip reka bentuk ini, Backend boleh ditukar dengan mudah.
Weidl ialah platform pembelajaran mesin yang dibangunkan sendiri oleh Weibo yang boleh memanggil pengendali pelbagai rangka kerja pembelajaran mendalam Anda juga boleh menggunakan mod Bridge dan bukannya menggantikan ia dengan sendiri Ia juga sangat mudah untuk mengira pengendali. Sebagai contoh, apabila kami menggunakan Tensorflow sebelum ini, kami akan melakukan beberapa peruntukan memori dan pengoptimuman operator pada tf Kami akan bertukar kepada DeepRec pada separuh kedua 2022. Selepas mengetahui lebih lanjut tentang DeepRec, kami akan mendapati bahawa beberapa titik pengoptimuman prestasi sebelumnya. berdasarkan tf adalah serupa dengan DeepRec.
Angka berikut menyenaraikan beberapa versi yang telah dibuat oleh pasukan kami selama bertahun-tahun untuk membantu anda memahami sumbangan setiap perkara teknikal dalam perniagaan kami berdasarkan model FM menyelesaikan masalah pengesyoran masa nyata berskala besar, dan kemudian mencipta struktur kompleks berdasarkan kedalaman. Berdasarkan keputusannya, penggunaan model tidak mendalam sebelum ini untuk menyelesaikan masalah masa nyata dalam talian juga telah membawa manfaat yang besar.
Pengesyoran aliran maklumat berbeza daripada pengesyoran aliran maklumat pada dasarnya berskala besar Seni bina dalam masa nyata. Terdapat juga beberapa kesukaran dan perbezaan dalam bidang ini Sebagai contoh, ciri masa nyata bukanlah alternatif kepada model masa nyata Untuk sistem pengesyoran, apa yang dipelajari oleh model adalah lebih penting Tetapi sebelum keuntungan mutlak boleh dibuat, ia boleh diatasi dengan masa.
Bab ini akan memperkenalkan model lelaran perniagaan dari aspek matlamat, struktur dan ciri.
Terdapat banyak operasi pengguna dalam adegan Weibo, dan pengguna akan menyatakan kecintaan mereka terhadap item tersebut. Terdapat banyak jenis gelagat, seperti interaksi klik, tempoh, lungsur turun, dsb. Setiap matlamat mesti dimodelkan dan dianggarkan, dan akhirnya penyepaduan dan kedudukan keseluruhan adalah sangat penting untuk perniagaan pengesyoran. Apabila ia mula-mula dilakukan, ia dilakukan melalui static fusion dan offline parameter search Kemudiannya, ia ditukar kepada dynamic parameter search melalui kaedah pembelajaran pengukuhan skor gabungan melalui tunggu model.
Pendekatan teras untuk mengukuhkan pelarasan parameter ialah , bahagikan trafik dalam talian kepada beberapa kumpulan trafik kecil, gunakan beberapa parameter dalam talian semasa untuk menjana beberapa parameter baharu, lihat reaksi pengguna terhadap parameter ini, kumpulkan maklum balas dan ulangi. Bahagian teras ialah pengiraan ganjaran, yang menggunakan CEM dan ES. Kemudian, algoritma yang dibangunkan sendiri telah digunakan untuk menyesuaikan diri dengan keperluan perniagaannya sendiri. Oleh kerana pembelajaran dalam talian berubah dengan sangat cepat, masalah besar akan timbul jika parameter tidak boleh berubah dengan sewajarnya parameter gabungan mesti mencerminkan perubahan dalam keutamaan pengguna untuk sesuatu.
Berikut ialah beberapa helah kecil dalam pengoptimuman model Pengguna menggunakannya secara kitaran setiap hari perlu untuk mematuhi pengedaran terdahulu, menjalankan analisis terdahulu terlebih dahulu, dan kemudian melakukan gabungan pembezaan mekanisme pengesanan anomali untuk memastikan bahawa parameter gabungan boleh dikemas kini secara konsisten dan berulang.
Aditive fusion dipilih sebagai formula gabungan pada mulanya tidak begitu banyak matlamat perniagaan Apabila bilangan matlamat bertambah, didapati bahawa gabungan aditif menyusahkan untuk menyokong penambahan lebih banyak matlamat dan akan melemahkan kepentingan setiap sub-matlamat Formula gabungan berganda digunakan kemudian. Kesannya ditunjukkan dalam ppt:
Selepas versi penuh dinaik taraf kepada berbilang tugasan, di sini Versi ini dioptimumkan untuk melaksanakan gabungan sasaran melalui model. Melalui gabungan model, banyak perkara bukan linear boleh ditangkap dengan lebih baik dan mempunyai kuasa ekspresif yang lebih baik Dengan cara ini, gabungan diperibadikan juga boleh dicapai, dan perkara yang digabungkan akan berbeza untuk setiap pengguna.
Sebelum melakukan multitasking, isu utama yang perlu diselesaikan termasuk: antara berbilang sasaran Sama ada terdapat konflik antara pelbagai kerugian, sama ada akan ada kesan jungkat-jungkit antara satu sama lain masalah ruang sampel yang tidak konsisten, dan lain-lain; Dalam pengalaman sebenar, kedua-dua kaedah PCGrad dan UWL akan menunjukkan kesannya dalam data ujian Walau bagaimanapun, jika ia diperbesarkan kepada persekitaran pengeluaran dan pembelajaran dan latihan dalam talian yang berterusan, kesan kaedah ini akan mereput lebih cepat, sebaliknya, menurut pengalaman Tidak mustahil untuk menetapkan beberapa nilai dalam keseluruhan persekitaran latihan dalam talian Saya tidak pasti sama ada ini berkaitan dengan pembelajaran dalam talian atau saiz sampel. Kesan melakukan MMOE sahaja juga agak baik Di sebelah kiri adalah beberapa titik keuntungan sebenar dalam perniagaan.
Berikut ialah beberapa evolusi teknologi bermula daripada MMOE. Langkah pertama untuk berbilang tugas ialah sambungan keras yang mudah, diikuti oleh MMOE, kemudian SNR atau PLE Ini adalah kaedah yang agak matang dalam industri dalam beberapa tahun kebelakangan ini. Pasukan ini menggunakan SNR dan melakukan dua pengoptimuman. Di bahagian bawah rajah di bawah, bahagian paling kiri ialah pendekatan kertas standard SNR Kami telah memudahkan transformasi dalam pakar. Pada masa yang sama, akan ada pakar eksklusif dan pakar yang dikongsi Di sini, beberapa analisis akan dilakukan berdasarkan nilai sebenar dan anggaran penyimpangan kesimpulan data yang diberikan semula dalam beberapa perniagaan sebenar, dan beberapa pakar bebas akan dibuat.
Kami bertanggungjawab terhadap banyak senario pengesyoran, jadi adalah wajar untuk memikirkan menggunakan beberapa teknologi berbilang senario. Multi-tasking bermakna bahawa beberapa sasaran agak jarang Berbilang adegan adalah besar dan kecil Konvergensi adegan kecil tidak begitu baik kerana jumlah data tidak mencukupi, manakala penumpuan adegan besar adalah lebih baik jika kedua-dua adegan itu lebih kurang sama, akan ada jurang di tengah-tengahnya. Sebahagian daripadanya melibatkan pemindahan ilmu yang akan menguntungkan perniagaan Ini juga menjadi trend hangat baru-baru ini dan mempunyai banyak persamaan teknikal dengan multitasking.
Berdasarkan setiap model berbilang tugas, model berbilang senario boleh dibuat, berbanding kepadaDalam struktur berbilang tugas, apa yang ditambah ialah lapisan Slot-gate dalam rajah di bawah Pembenaman yang sama menyatakan fungsi yang berbeza untuk senario yang berbeza melalui Slot-gate. Output melalui Slot-gate boleh dibahagikan kepada tiga bahagian: menyambung ke rangkaian pakar, menyambung ke tugas sasaran, atau menyambung ke ciri.
Model utama terutamanya menggunakan SNR untuk menggantikan CGC, yang konsisten dengan lelaran berbilang tugas. Berikut ialah aplikasi semasa berbilang tugas dan berbilang senario yang digabungkan bersama dalam dua senario perniagaan dalaman: hangat dan popular. Antaranya, pengesyoran halaman utama ialah strim popular dan pengesyoran halaman penemuan ialah strim hangat.
Struktur keseluruhan adalah serupa dengan SNR, dengan tiga menara sasaran klik, interaksi dan tempoh. Antaranya, ketiga-tiga menara sasaran ini dibahagikan kepada enam sasaran untuk dua adegan popular dan popular. Di samping itu, lapisan Transformasi Benam ditambahkan Berbeza daripada Gerbang-Slot, Gerbang-Slot adalah untuk mencari kepentingan ciri, manakala lapisan transformasi Benamkan adalah untuk mempertimbangkan perbezaan dalam membenamkan ruang dalam senario yang berbeza untuk melaksanakan pemetaan benam. Sesetengah ciri mempunyai dimensi berbeza dalam dua adegan dan diubah melalui lapisan transformasi Benam.
Faedah. Pencirian ialah teknologi yang telah banyak disebut dalam beberapa tahun kebelakangan ini Daripada DIN Alibaba kepada SIM dan DMT, ia telah menjadi arus perdana pemodelan jujukan tingkah laku pengguna dalam industri.
DIN digunakan pada mulanya untuk membina berbilang jujukan tingkah laku untuk tingkah laku yang berbeza. Mekanisme perhatian diperkenalkan untuk memberikan pemberat yang berbeza kepada bahan yang berbeza dalam tingkah laku, dan unit pengaktifan tempatan digunakan untuk mempelajari pengagihan berat jujukan pengguna dan bahan yang diisih calon semasa, merealisasikan penyelesaian kedudukan halus yang popular dan mencapai perniagaan tertentu faedah.
Inti DMT ialah menggunakan Transformer pada berbilang tugas Pasukan kami menggunakan model DMT yang dipermudah, mengalih keluar modul bias, menggantikan MMoE dengan SNR dan pergi ke dalam talian Akhirnya, keputusan perniagaan tertentu telah dicapai.
Berbilang DIN mengembangkan berbilang jujukan dan menggunakan pertengahan, teg, authorid, dsb. bahan calon sebagai pertanyaan . Selepas secara berasingan memberi perhatian kepada setiap urutan untuk mendapatkan perwakilan minat, ciri-ciri lain disambungkan ke dalam model pemeringkatan berbilang tugas.
Pada masa yang sama, kami juga menjalankan eksperimen dan mendapati bahawa kami boleh membuat urutan lebih panjang, seperti klik , tempoh, dan urutan interaksi dsb., kesannya adalah lebih baik jika setiap jujukan dikembangkan daripada 20 kepada 50, yang konsisten dengan kesimpulan dalam kertas, tetapi jujukan yang lebih panjang memerlukan lebih banyak kos kuasa pengkomputeran.
Pemodelan jujukan ultra panjang kitaran hayat pengguna adalah berbeza daripada pemodelan jujukan panjang sebelumnya Data tidak boleh ditarik dengan meminta ciri , tetapi untuk membina ciri jujukan tingkah laku panjang pengguna di luar talian atau untuk mencari ciri yang sepadan melalui beberapa kaedah carian dan kemudian menjana pembenaman atau memodelkan model utama dan model jujukan ultra-panjang secara berasingan, dan akhirnya membentuk pembenaman dan menghantarnya ke; tengah model utama.
Dalam perniagaan Weibo, nilai urutan yang sangat panjang tidaklah begitu hebat, kerana tumpuan semua orang berubah dengan cepat di Internet, seperti carian panas, Ia secara beransur-ansur hilang dalam masa satu atau dua hari, dan kandungan dari tujuh hari yang lalu dalam aliran maklumat diedarkan kurang. Oleh itu, jujukan tingkah laku pengguna yang terlalu panjang akan melemahkan anggaran nilai keutamaan pengguna untuk item tersebut ke tahap tertentu. Tetapi untuk pengguna frekuensi rendah atau kembali, kesimpulan ini berbeza pada tahap tertentu.
Gunakan bersaiz besar. Model berskala besar juga akan menghadapi beberapa masalah pada tahap ciri. Sebagai contoh, beberapa ciri secara teorinya dianggap membantu model, tetapi kesan selepas menambahkannya tidak dapat memenuhi jangkaan Ini juga realiti yang dihadapi oleh perniagaan pengesyoran. Oleh kerana skala model adalah sangat besar, banyak maklumat kelas id telah ditambahkan pada model, yang telah memberikan ekspresi yang baik kepada beberapa pilihan pengguna Menambah beberapa ciri statistik pada masa ini mungkin tidak begitu mudah untuk digunakan. Mari kita bercakap tentang pasukan ini Ciri-ciri yang agak mudah untuk digunakan dalam amalan.
Pertama sekali, kesan ciri padanan adalah agak baik Pengguna boleh mencipta beberapa data statistik yang lebih terperinci untuk satu bahan, satu jenis kandungan dan a blogger tunggal boleh membawa beberapa faedah.
Selain itu, ciri berbilang modal juga lebih bernilai, kerana keseluruhan model pengesyoran adalah berdasarkan tingkah laku pengguna, dan terdapat beberapa rendah- kekerapan dan yang tidak popular. Tingkah laku pengguna item tidak mencukupi dalam keseluruhan sistem Pada masa ini, memperkenalkan lebih banyak pengetahuan terdahulu boleh membawa lebih banyak faedah. Multimodaliti memperkenalkan kumpulan semantik melalui pengenalan NLP dan teknologi lain, yang membantu kedua-dua frekuensi rendah dan permulaan sejuk.
Pasukan ini telah melakukan dua jenis kaedah untuk memperkenalkan ciri berbilang modal: jenis pertama ialah menyepadukan benam berbilang modal ke dalam model pengesyoran, membekukan kecerunan benam asas ini dan kemudian beralih ke bahagian atas Kemas kini MLP; kaedah lain ialah menggunakan berbilang modaliti untuk melaksanakan pengelompokan sebelum memasuki model pengesyoran, dan membuang ID kluster ke dalam model yang disyorkan untuk latihan Ini adalah cara yang lebih mudah untuk memperkenalkan maklumat kepada model pengesyoran maklumat semantik tertentu juga akan hilang.
Dua kaedah di atas telah banyak dicuba dalam perniagaan kami Kaedah pertama akan meningkatkan kerumitan model dan memerlukan banyak transformasi spatial, mencari kepentingan ciri, dll., tetapi ia boleh Membawa manfaat yang baik. ; kaedah kedua menggunakan ID kluster untuk belajar, kerumitan adalah di luar model, perkhidmatan dalam talian agak mudah, kesannya boleh mencapai kira-kira 90%, dan anda juga boleh melakukan beberapa statistik pada ID kluster Ciri-ciri seksual, digabungkan, berfungsi dengan baik.
Selepas menambah ciri berbilang modal, faedah terbesar ialah bahan dedahan rendah berkualiti tinggi, yang boleh menyelesaikan sejuk mulakan soalan. Mengesyorkan bahan dengan pendedahan yang agak sedikit, yang model tidak dapat belajar sepenuhnya, akan sangat bergantung pada badan berbilang modal untuk membawa lebih banyak maklumat, yang juga bernilai positif kepada ekologi perniagaan.
Motivasi Co-action adalah untuk mencuba persimpangan deepfm, wide deep dan ciri lain Kaedah ini tidak membuahkan hasil dan ia disyaki disebabkan oleh konflik antara ciri silang dan pembenaman kongsi separa DNN. Tindakan bersama adalah bersamaan dengan menambah storan dan membuka ruang storan yang berasingan untuk bersilang Ini meningkatkan ruang ekspresi dan juga memperoleh keuntungan yang baik dalam perniagaan.
Bahagian ini adalah mengenai pengisihan dan ingatan secara kasar. Untuk perniagaan pengesyoran, walaupun kuasa pengkomputeran tidak dapat menyokong pengisihan berjuta-juta set calon, dan ia dibahagikan kepada ingatan semula, pengisihan kasar dan pengisihan halus, logiknya adalah isu yang sama. Sebagai contoh, seperti yang ditunjukkan dalam rajah di bawah, pengisihan kasar akan dipotong, dan kandungan akhir untuk pengisihan halus hanya akan menjadi kira-kira 1,000 Jika ungkapan pengisihan kasar dan pengisihan halus berbeza dengan ketara, semasa proses penyisihan, pengisihan halus. skor mungkin akan lebih tinggi pada masa hadapan. Ciri dan struktur model pengisihan halus dan pengisihan kasar secara amnya serupa dengan rangka kerja penarikan balik, yang merupakan struktur anggaran perolehan vektor kemudian, dan ia adalah wajar untuk perbezaan ekspresi dengan pengisihan halus model untuk muncul. Jika konsistensi boleh dipertingkatkan, penunjuk perniagaan juga akan meningkat kerana kedua-dua pihak boleh menangkap trend perubahan yang sama.
Rajah berikut menunjukkan konteks teknikal proses lelaran konsistensi kasar di atas ialah Barisan teknikal Menara Berkembar, di bawah ialah talian teknikal DNN. Memandangkan ciri-ciri Menara Berkembar berinteraksi agak lewat, banyak cara untuk ciri-ciri Menara Berkembar bersilang telah ditambah. Walau bagaimanapun, siling kaedah pengambilan vektor agak terlalu rendah, jadi bermula dari 2022, akan ada cawangan DNN untuk penyisihan kasar, yang akan memberi tekanan yang lebih besar pada seni bina kejuruteraan, seperti penapisan ciri, pemangkasan rangkaian, pengoptimuman prestasi , dsb., dan Bilangan item yang dijaringkan pada satu masa juga akan dikurangkan daripada sebelumnya, tetapi markahnya lebih baik, jadi bilangan item yang lebih kecil boleh diterima.
DSSM-autowide ialah crossover serupa dengan Deep-FM berdasarkan Menara Berkembar, dengan Terdapat peningkatan dalam penunjuk perniagaan, tetapi untuk projek seterusnya, menggunakan kaedah silang silang baharu, peningkatan itu tidak begitu ketara.
Oleh itu, kami merasakan manfaat yang boleh kami perolehi berdasarkan menara berkembar adalah agak terhad. Kami juga mencuba model berbilang tugas kasar berdasarkan menara berkembar, tetapi kami masih tidak dapat mengatasi masalah menara berkembar.
Berdasarkan masalah di atas, pasukan kami mengoptimumkan model kasar, menggunakan DNN dan tahap Model bersama ialah Stacking seni bina.
Model lata boleh ditapis terlebih dahulu dengan menara berkembar, dan kemudian ditapis dan dipotong kepada model DNN untuk pengisihan kasar, yang bersamaan dengan melakukan pengisihan kasar dan pengisihan halus di dalam pengisihan kasar . Selepas bertukar kepada model DNN, ia boleh menyokong struktur yang lebih kompleks dan lebih cepat menyesuaikan diri dengan perubahan dalam minat pengguna.
Lata memainkan peranan penting dalam rangka kerja Tanpa model lata, ia tidak mungkin menjadi Set calon yang kecil dipilih daripada set calon yang agak besar untuk digunakan oleh DNN kasar. Perkara yang lebih penting dalam lata ialah cara membina sampel Anda boleh lihat rajah di bawah. Daripada perpustakaan bahan peringkat juta, kami mengingati beribu-ribu pengisihan kasar dan pengisihan halus dalam 1,000 Akhirnya, kira-kira 20 item telah didedahkan, dan bilangan tindakan pengguna adalah dalam satu digit Proses keseluruhan adalah daripada yang lebih besar perpustakaan kepada pengguna proses corong tingkah laku. Apabila melakukan lata, titik teras ialah setiap bahagian mesti diambil sampel untuk membentuk beberapa pasangan yang sukar dan pasangan yang agak mudah untuk dipelajari daripada model lata.
Rajah berikut menunjukkan faedah yang dibawa oleh pengoptimuman lata dan pensampelan negatif global, iaitu tidak disertakan di sini Berikan pengenalan terperinci.
Berikut memperkenalkan inferens sebab yang popular baru-baru ini. Motivasi kami untuk menggunakan inferens kausal ialah jika kami menolak sesuatu yang semua orang suka, kesan klik pengguna akan menjadi baik, tetapi pengguna itu sendiri Terdapat juga beberapa minat yang agak khusus Kami mengesyorkan bahan khusus ini kepada pengguna, dan pengguna juga lebih menyukainya. Kedua-dua perkara ini adalah sama untuk pengguna, tetapi untuk platform, lebih banyak perkara khusus yang boleh diperkenalkan adalah lebih diperibadikan, dan jenis pertama lebih mudah diperolehi oleh model adalah untuk menyelesaikan masalah ini . Kaedah khusus ialah mengumpulkan pasangan sampel berpasangan Untuk bahan yang diklik oleh pengguna dan mempunyai populariti yang rendah, dan bahan yang sangat popular tetapi tidak diklik pengguna, gunakan kaedah Bayesian digunakan untuk melatih model kerugian. Dalam amalan kami, adalah lebih mudah untuk memperoleh faedah dengan melakukan inferens sebab dalam peringkat pengisihan dan ingatan kasar berbanding dalam pengisihan halus. Sebabnya ialah model penarafan halus agak rumit sudah mempunyai keupayaan pemperibadian yang baik Walau bagaimanapun, walaupun kedudukan kasar dan penarikan semula menggunakan DNN, ia juga merupakan DNN yang dipotong . Keupayaan pemperibadian agak lemah Kesan penggunaan inferens sebab di tempat pasti lebih jelas daripada menggunakannya di tempat yang mempunyai keupayaan pemperibadian yang kuat.
Penyusunan semula menggunakan kaedah carian pancaran untuk mereka bentuk fungsi ganjaran digabungkan dengan model lungsur turun SETERUSNYA untuk menjana pelbagai jujukan calon dan memilih jujukan yang paling hebat keuntungan. Selepas pengembangan Kesannya tidak stabil dan butiran sedang dioptimumkan lagi.
Algoritma berdasarkan jalan rawak, struktur graf, pembelajaran perbandingan graf dan algoritma lain boleh digunakan dalam cadangan untuk menjadikan pengguna dan catatan blog, Mengingat kembali interaksi/perhatian antara pengguna dan pengarang. Kaedah arus perdana adalah untuk membenamkan imej, teks, pengguna, dsb., dan menambahkan ciri pada model Terdapat juga beberapa percubaan yang lebih canggih, seperti membina rangkaian hujung ke hujung secara terus dan menggunakan GNN untuk cadangan.
Gambar di bawah ialah model hujung ke hujung semasa ia. Tiada versi arus perdana dalam talian.
Gambar berikut adalah berdasarkan rangkaian graf untuk menjana pembenaman, dan gambar di yang betul adalah berdasarkan domain akaun Persamaan yang dikira. Untuk Weibo, adalah menguntungkan untuk mengira pembenaman berdasarkan hubungan perhatian.
J1: Ya, apabila ia berkaitan dengan perniagaan aliran maklumat, tempoh ialah penunjuk pengoptimuman yang lebih penting. Tidak mudah untuk mengoptimumkan secara langsung tempoh pengguna kekal pada APP secara keseluruhan hari ini apabila menggunakan penunjuk pengoptimuman tempoh Perkara yang lebih dioptimumkan ialah tempoh mereka kekal pada item. Jika tempoh tidak dianggap sebagai matlamat pengoptimuman, lebih mudah untuk mempromosikan banyak kandungan penggunaan cetek.
A2: Pada masa ini, untuk pembelajaran dan latihan yang disyorkan, jika ia adalah CPU, terdapat lebih banyak asynchronous, dan orang ramai tidak cenderung melakukannya dengan pusingan global , dsb. Selepas pusingan tamat, kumpulkan mereka bersama-sama, kemas kini mereka pada PS, dan kemudian mulakan pusingan seterusnya Kerana isu prestasi, orang pada dasarnya tidak akan melakukan ini. Tidak kira sama ada pembelajaran masa nyata atau dalam talian, konsistensi yang kukuh tidak boleh dicapai.
Jika kegagalan lebih berlaku semasa latihan anda, jika anda melakukan latihan penstriman, ia akan direkodkan pada aliran data, seperti kafka atau flink, untuk dirakam semasa anda Di mana sahaja rancangan dilatih, ps anda juga mempunyai rekod latihan terakhir anda, yang serupa dengan perbezaan global.
A3: Had atas lelaran boleh difahamkan sebagai siling penarikan balik maka saya faham bahawa siling penarikan semula pastinya tidak melebihi kedudukan yang baik. jika kuasa pengkomputeran kini tidak terhingga , maka menggunakan pengisihan halus untuk menjaringkan 5 juta bahan ialah cara terbaik untuk mengendalikan perniagaan. Apabila penarikan balik bukanlah pelaburan yang besar, kami cuba mencari untuknya bahagian terbaik semakan Sebagai contoh, biarkan dia memilih 15 teratas daripada 6,000 dalam panggilan balik dan 15 teratas daripada 5 juta, yang mana. Modul penarikan semula berfungsi dengan lebih baik. Jika semua orang memahami perkara ini, maka mengingati susunan pengisihan halus tidak akan mengurangkan lelaran dalam talian, tetapi akan bergerak ke arah had atas. Walau bagaimanapun, ini juga pendapat kami Bergantung pada orientasi perniagaan anda sendiri, kesimpulannya mungkin tidak boleh digunakan secara universal.
Atas ialah kandungan terperinci Evolusi teknikal model besar masa nyata untuk cadangan Weibo. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!