Amalan algoritma graf dalam sistem kawalan risiko Alibaba-AI-php.cn

Jadual Kandungan

1 Pengenalan kepada algoritma graf dalam senario kawalan risiko e-dagang" >1 Pengenalan kepada algoritma graf dalam senario kawalan risiko e-dagang

1 Ciri-ciri risiko e-dagang Alibaba" >1 Ciri-ciri risiko e-dagang Alibaba

2. Algoritma graf untuk kawalan risiko kandungan interaktif " >2. Algoritma graf untuk kawalan risiko kandungan interaktif

2. Integrasi pengkomputeran graf dan graf pengetahuan risiko " >2. Integrasi pengkomputeran graf dan graf pengetahuan risiko

4. Amalan kawalan risiko graf heterogen dinamik" >4. Amalan kawalan risiko graf heterogen dinamik

1. Pembelajaran automatik graf dinamik " >1. Pembelajaran automatik graf dinamik

2. Grafik dinamik pembelajaran mantap " >2. Grafik dinamik pembelajaran mantap

6 Ringkasan dan pandangan tentang pelaksanaan algoritma graf " >6 Ringkasan dan pandangan tentang pelaksanaan algoritma graf

Pandangan kerja susulan: " >Pandangan kerja susulan:

7. Rujukan" >7. Rujukan

8. Sesi Soal Jawab" >8. Sesi Soal Jawab

S1: Apakah cabaran khas bagi perwakilan graf bagi senario kawalan risiko, berbanding dengan perwakilan graf dalam bidang lain? " >S1: Apakah cabaran khas bagi perwakilan graf bagi senario kawalan risiko, berbanding dengan perwakilan graf dalam bidang lain?

S2: Apakah model algoritma semasa pembelajaran bersekutu graf Adakah terdapat penyelesaian yang matang dalam industri? Adakah anda mempunyai sebarang aplikasi atau pertimbangan untuk pembelajaran bersekutu graf? " >S2: Apakah model algoritma semasa pembelajaran bersekutu graf Adakah terdapat penyelesaian yang matang dalam industri? Adakah anda mempunyai sebarang aplikasi atau pertimbangan untuk pembelajaran bersekutu graf?

Rumah

Peranti teknologi

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

王林

May 29, 2023 pm 07:28 PM

algoritma

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

1 Pengenalan kepada algoritma graf dalam senario kawalan risiko e-dagang

Pertama sekali, berikan ringkasan gambaran keseluruhan risiko e-dagang Alibaba Ciri-ciri, sejarah aplikasi dan status semasa algoritma graf.

1 Ciri-ciri risiko e-dagang Alibaba

Ciri-ciri utama risiko e-dagang Alibaba: konfrontasi & permutasi dan kerumitan formula gabungan.

Risiko mestilah konfrontasi, dan risiko e-dagang Alibaba juga kompleks dalam pilih atur dan gabungan. Pengenalpastian risiko terutamanya menggunakan X (data) untuk meramalkan Y (risiko): P(Y|X). Dalam e-dagang Alibaba , Tmall, 1688, Lazada, dsb., ciri-ciri risiko pasaran yang berbeza adalah berbeza; , promosi, dsb., dan Dengan lelaran dan inovasi perniagaan, risiko baharu akan timbul; setiap terminal perlu Lakukan pencegahan dan kawalan;

④ Sumber data yang pelbagai memerlukan keupayaan untuk memproses dan menyepadukan data dalam modaliti yang berbeza.

Pada masa yang sama, Y juga sangat kompleks, terutamanya dicerminkan dalam tiga aspek. Yang pertama ialah jenis risiko Banyak, risiko kandungan biasa, risiko tingkah laku, dsb. hanyalah penurunan dalam lautan banyak risiko kedua, risiko ini berkaitan, seperti penipuan penjual berkaitan dengan pendaftaran, kecurian dan kandungan produk; ; ketiga, risiko akan dipindahkan Satu jenis risiko lebih baik dicegah, tetapi kos melakukan jenayah adalah tinggi, dan kemudiannya dipindahkan kepada risiko lain atau mewujudkan risiko baru.

Jadi keseluruhan pencegahan dan kawalan risiko adalah sangat rumit, dengan pilih atur dan gabungan kerumitan.

2. Kepentingan algoritma graf

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

Algoritma graf boleh meningkatkan keupayaan konfrontasi model pengenalan risiko. Kebanyakan "perkara buruk" di platform hanya dilakukan oleh beberapa orang "orang jahat" mempunyai banyak jaket Kita boleh mengetahui petunjuk melalui "hubungan" dan mengenal pasti dan berurusan dengan mereka terlebih dahulu. Sebagai contoh, titik kuning dalam gambar di bawah, dengan mengandaikan ia adalah pengguna yang mempunyai tingkah laku yang tidak normal, sukar untuk menilai bahawa dia adalah pengguna penipuan berdasarkan tingkah lakunya sendiri sahaja, tetapi ia boleh dianalisis dengan menganalisis tiga pengguna penipuan yang lain. dikaitkan dengannya (titik hitam) untuk menentukan bahawa dia adalah pengguna yang menipu. Pada masa yang sama, kami mendapati semua akaun yang berkait rapat dengan keempat-empat akaun ini dan mendapati bahawa mereka adalah geng Jika melupuskan akaun ini secara berkelompok terlebih dahulu boleh meningkatkan kos melakukan kejahatan.

Selain itu, graf heterogen secara semula jadi dan global boleh mengintegrasikan pelbagai modaliti dan objek risiko Data, kira perwakilan objek yang berbeza, dan kemudian kenal pasti risiko yang berbeza untuk menangani kerumitan pilih atur dan kombinasi

3 Sejarah dan situasi semasa algoritma graf

Berdasarkan kepentingan algoritma graf, kawalan risiko e-dagang Alibaba telah menggunakan algoritma graf sejak 2013.

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

Pada mulanya algoritma graf digunakan untuk membina rangkaian perhubungan seluruh pustaka akaun. Data perhubungan ini adalah data asas yang diperlukan untuk semua senario pencegahan dan kawalan risiko seperti penipuan, keselamatan akaun, anti-penipuan dan barangan palsu. Data utama yang digunakan termasuk data media seperti maklumat peranti dan nombor telefon mudah alih. Ia terutamanya menerangkan korelasi antara akaun, jenis perhubungan, pengenalan kumpulan, dsb. Saluran maklum balas gelung tertutup daripada pengeluaran kepada aplikasi telah diwujudkan untuk rangkaian perhubungan ini.

Terdapat banyak data hubungan asas Kos keseluruhan pengagregatan, pembersihan, pengiraan graf dan penyimpanan data hubungan adalah sangat tinggi, dan ia mesti dikemas kini secara berterusan kemudian, jadi membina hubungan Kos. rangkaian adalah tinggi, tetapi kerana banyak model dan strategi risiko kami bergantung pada rangkaian perhubungan ini, ia masih berbaloi.

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

Bagi rangkaian neural graf, kami mula meneroka aplikasi pada 2016. Kami juga dipanggil GGL (Pembelajaran Graf Geometrik Pada masa itu, tiada rangka kerja algoritma rangkaian saraf graf yang tersedia, jadi kami melaksanakan rangka kerja algoritma GGL dalam C++. Pada tahun 2018, ia telah dipindahkan ke Graph learning yang disediakan oleh Alibaba Computing Platform Rangka kerja ini juga merupakan sumber terbuka Kami turut menyumbang beberapa kod algoritma graf kepada rangka kerja ini.

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

Terdapat banyak senario kawalan risiko e-dagang, dan ia juga penting untuk dipilih senario yang sesuai semasa fasa pengesahan algoritma graf Terutama penting. "Kriteria penilaian" untuk risiko tingkah laku, yang menyumbang sebahagian besar dalam senario risiko, tidak intuitif Dalam senario industri, sampel putih risiko tingkah laku dicampur dengan banyak sampel hitam yang belum ditemui Apabila algoritma graf menilai sampel putih sebagai hitam sampel, adalah sukar untuk menilai sama ada ia adalah sampel hitam atau tidak sama ada ia adalah panggilan palsu atau perolehan semula, ini akan menjejaskan penalaan model dan pertimbangan kesan dalam talian. Sebaliknya, senario keselamatan kandungan, seperti spam dan penghinaan, adalah senario dengan "kriteria pertimbangan intuitif" dan lebih sesuai untuk mengesahkan keberkesanan algoritma graf. Oleh itu, kami mula-mula meneroka algoritma dalam senario keselamatan kandungan, mengesahkan keberkesanannya dan mengumpul amalan terbaik, dan kemudian menggunakannya pada senario risiko tingkah laku.

Setakat ini, algoritma graf digunakan dalam pelbagai perniagaan berisiko e-dagang Alibaba. Keseluruhan rangka kerja algoritma graf adalah seperti yang ditunjukkan di bawah Pertama, lapisan data relasi dikekalkan di bahagian bawah untuk mengumpul dan membersihkan pelbagai data relasi untuk memudahkan aplikasi lapisan atas, algoritma graf yang biasa digunakan dicetuskan; lapisan seterusnya menggunakan lapisan data hubungan dan lapisan algoritma untuk membina rangkaian perhubungan akaun, yang secara mendatar menyokong pencegahan dan kawalan pelbagai senario risiko di lapisan perniagaan teratas, digabungkan dengan ciri-ciri risiko tertentu , kami menggunakan algoritma graf dan data hubungan ini untuk membina model graf untuk mengenal pasti pelbagai risiko perniagaan.

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

Perkongsian berikut terutamanya akan memperkenalkan "risiko kandungan interaktif", "larangan dan sekatan komoditi", "barangan palsu" Beberapa algoritma graf digunakan untuk tiga jenis risiko ini: "Tadbir urus".

2. Algoritma graf untuk kawalan risiko kandungan interaktif

Platform e-dagang Alibaba mempunyai senario kandungan interaktif yang kaya. Seperti penilaian produk, komen, bertanya kepada semua orang, serta membeli-belah Taobao mudah alih, komuniti Xianyu, dsb. Berikut menggunakan pengenalan iklan spam dalam mesej Xianyu sebagai contoh untuk memperkenalkan algoritma graf kawalan risiko kandungan.

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

Adalah mudah untuk melihat "iklan spam" dalam ulasan produk dalam risiko Kandungan APP Xianyu seperti kerja sambilan, pesanan palsu, menjual pil penurunan berat badan, dsb., dan sangat berkonfrontasi Sebagai contoh, dalam tangkapan skrin di atas, "Abang, lihat saya," iklan sebenar bukan dalam teks itu sendiri, tetapi. pada halaman utama pengguna.

Pengenalpastian iklan spam dalam Xianyu Messages ialah senario aplikasi pertama bagi algoritma rangkaian saraf graf kami, singkatannya, model pengenalan ini GAS. Keseluruhan model terdiri daripada graf heterogen dan graf homogen. Graf heterogen mempelajari perwakilan tempatan setiap nod, termasuk produk, ulasan dan pengguna Graf homogen ialah graf ulasan yang mempelajari perwakilan global bagi ulasan yang berbeza Akhirnya, empat perwakilan ini disatukan untuk latihan model klasifikasi.

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

Set data latihan keseluruhan termasuk ulasan 3kw+, produk 2kw+ dan 9 juta+ pengguna Selepas pergi ke dalam talian, ia telah menarik balik risiko 30% daripada model MLP asal. Di samping itu, percubaan ablasi juga telah mengesahkan bahawa menambah maklumat global juga bertambah baik dengan ketara Ini disebabkan oleh ciri-ciri pengiklanan spam itu sendiri - ia memerlukan sejumlah besar pemajuan untuk mencapai faedah yang lebih baik. Karya ini akhirnya disusun dan diterbitkan dalam kertas[1], dan memenangi Kertas Penyelidikan Gunaan Terbaik CIKM2019.

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

3. >Di sini kami memperkenalkan terutamanya dua jenis algoritma graf untuk kawalan risiko kandungan produk: satu ialah pembelajaran struktur graf produk, dan satu lagi ialah penyepaduan struktur graf produk dan graf pengetahuan profesional.

Amalan algoritma graf dalam sistem kawalan risiko Alibaba Pengurusan risiko komoditi adalah terutamanya untuk mengawal risiko "jualan terlarang dan jualan terhad". dilarang oleh undang-undang dan peraturan negara Untuk dijual, seperti haiwan dan tumbuhan yang dilindungi negara, penipuan dan pemalsuan, peranti perubatan terkawal, dsb.

Pengurusan dan kawalan produk adalah sangat rumit Data produk ialah aliran berbilang data, berbilang saluran dan berbilang modal:

① Berbilang aliran data:

Tajuk, perihalan, imej utama, imej kedua, imej butiran, SKU; >② Berbilang saluran:

Bunyi, bentuk dan makna teks, RGB bagi gambar; 🎜>

③ Berbilang modal: Teks, gambar, maklumat meta (harga, jualan).

Pada masa yang sama, risiko kandungan produk juga kompleks, pelbagai dan sengit dipertandingkan Contohnya dalam gambar di atas, nampaknya anda sedang menjual manik, tetapi sebenarnya anda menjual gading.

Terdapat dua jenis utama algoritma peta kawalan risiko kandungan produk: satu ialah model gabungan pelbagai mod, yang menggunakan model mendalam untuk membina saraf produk Rangkaian gabungan pelbagai mod menjalankan pembelajaran pelbagai tugas, yang merupakan pembelajaran maklumat tempatan barangan, yang lain adalah untuk meningkatkan penarikan semula risiko, menggunakan graf heterogen untuk mewujudkan hubungan antara barang dan barang, barang dan penjual; dan penjual, menjalankan pembelajaran gabungan maklumat global.

1. Pembelajaran struktur graf bagi graf produk

Intipati GCN ialah pelicinan ciri yang menggabungkan ciri jiran, jadi Pembelajaran rangkaian neural graf mempunyai keperluan tertentu terhadap kualiti struktur graf Graf rangkaian yang baik adalah padat dan mempunyai kadar homogeniti yang tinggi. Walau bagaimanapun, graf produk risiko adalah jarang dan kadar homogeniti adalah agak rendah (0.15, dan statistik pada set data awam mendapati bahawa 0.6 atau ke atas adalah lebih baik), jadi kita mesti mempelajari struktur graf.

Terdapat tiga jenis tepi dalam gambar produk, yang membentuk tiga jenis gambar, seperti yang ditunjukkan dalam bingkai di sebelah kanan gambar di bawah: Satu jenis ialah Kedua-dua produk dijual oleh penjual yang sama dan mempunyai imej penjual yang sama Kategori kedua ialah imej semak imbas yang kedua-dua produk telah dilihat oleh pengguna yang sama kategori ialah imej penjual yang berkaitan di mana penjual kedua-dua produk itu sangat berkaitan.

Intipati pembelajaran struktur graf produk ialah proses menambah dan memadam tepi: pertama, gunakan Graf KNN untuk membina graf KNN berdasarkan pembenaman produk, dan kemudian letakkan empat di atas jenis tepi bersama-sama dengan pembenaman produk HGT mempelajari pembenaman produk baharu dan memadamkan tepi dengan nilai perhatian yang lebih rendah sebagai kebisingan. Amalan dalam data sebenar menunjukkan bahawa rangka kerja pembelajaran struktur graf ini mencapai keputusan SOTA berbanding dengan graf homogen/graf heterogen. Amalan algoritma graf dalam sistem kawalan risiko Alibaba

2. Integrasi pengkomputeran graf dan graf pengetahuan risiko

Algoritma penambahbaikan algoritma graf produk ialah gabungan pengkomputeran graf dan graf pengetahuan risiko. Sesetengah risiko komoditi sukar dinilai melalui akal dan memerlukan gabungan pengetahuan domain profesional tertentu. Oleh itu, graf pengetahuan khusus telah dibina untuk mata pengetahuan domain risiko khusus ini untuk membantu pengenalpastian model dan semakan manual.

Sebagai contoh, kedua-dua produk yang ditunjukkan di sebelah kiri gambar di bawah nampaknya menjual aksesori ringkas, tetapi mereka sebenarnya menjual tanduk antelop Tibet, dan Antelop Tibet ialah haiwan kebangsaan Ia adalah haiwan yang dilindungi peringkat pertama dan produk berkaitannya adalah diharamkan. Kita boleh mengenal pasti risiko produk ini dengan memadankannya dengan pengetahuan yang berkaitan dengan antelop Tibet. Rangka kerja algoritma gabungan ditunjukkan di sebelah kanan rajah di bawah: matlamat model adalah untuk menentukan sama ada produk calon dan mata pengetahuan risiko sepadan. Item p ialah perwakilan grafik produk, dan Titik Risiko R ialah perwakilan titik pengetahuan Melalui pengiktirafan entiti, pemautan entiti dan pengekstrakan perhubungan, subgraf produk dan titik pengetahuan diperoleh, dan kemudian GNN digunakan. untuk mengira perwakilan subgraf, dan akhirnya perwakilan digunakan Menjalankan klasifikasi dan pengenalpastian risiko. Antaranya, CPR ialah gabungan perwakilan produk dan perwakilan titik pengetahuan Ia digunakan terutamanya untuk membimbing perwakilan graf untuk mempelajari beberapa maklumat global. Amalan menunjukkan bahawa berbanding dengan pengiktirafan pelbagai mod produk, penarikan balik risiko jangka panjang dipertingkatkan sebanyak lebih daripada 10 mata dengan menambahkan graf pengetahuan risiko.

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

Atas dasar ini, kami juga cuba memperkenalkan peta produk global. Apabila kandungan produk berkaitan secara langsung dengan peta pengetahuan dan risikonya tidak dapat dikenal pasti, anda boleh memperkenalkan perkaitan antara produk dan produk untuk membantu dalam pertimbangan Contohnya, dalam gambar di bawah, produk bertanda "Ada juga cubs" dan "tupai perut merah" tidak mempunyai pengetahuan yang kukuh. Terdapat hubungan yang sepadan, tetapi produk ini sepadan dengan pengetahuan penjual tentang produk lain "tupai perut merah" dan "tupai perut merah", jadi boleh disimpulkan bahawa produk sebenarnya menjual tupai perut merah (haiwan dilindungi sekunder, dilarang untuk dijual). Amalan telah menunjukkan bahawa memperkenalkan keseluruhan graf produk besar apabila melakukan penaakulan pengetahuan boleh meningkatkan penarikan semula risiko ekor panjang lebih daripada 3%.

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

4. Amalan kawalan risiko graf heterogen dinamik

Sebelumnya algoritma graf yang diperkenalkan adalah terutamanya aplikasi perlombongan graf statik, tetapi banyak senario risiko mempunyai corak risiko graf dinamik.

Contohnya, peniaga yang menjual barangan tiruan mula-mula mendaftar, kemudian mengeluarkan sejumlah besar produk secara berkelompok, menggembar-gemburkan untuk menarik trafik, dan kemudian dengan cepat menjual barangan tiruan barang. Dalam siri tindakan ini, dimensi masa ialah Perubahan dalam struktur graf adalah sangat penting untuk pengenalpastian risiko kami, jadi graf dinamik juga merupakan arah utama dalam penerokaan dan aplikasi algoritma graf.

Cabaran terbesar graf dinamik ialah cara mereka bentuk dan mencari struktur graf yang baik. Di satu pihak, graf dinamik memperkenalkan dimensi masa berdasarkan graf heterogen asal Contohnya, jika terdapat 30 momen, maka parameter (jumlah maklumat) graf dinamik adalah 30 kali ganda daripada graf heterogen, yang membawa besar. tekanan kepada pembelajaran; Sebaliknya, disebabkan sifat risiko yang bertentangan, graf dinamik perlu sangat teguh.

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

1. Pembelajaran automatik graf dinamik

Menurut ini, kami mencadangkan GNN dinamik berasaskan pada Attention + AutoML, pilih struktur model terbaik (DHGAS) di bawah ruang parameter tertentu. Teras model ini adalah untuk mengoptimumkan struktur model melalui pembelajaran automatik, seperti yang ditunjukkan dalam rajah di bawah: Pertama sekali lebih disukai untuk menguraikan graf dinamik kepada graf heterogen pada momen yang berbeza, dan menetapkan ruang fungsi yang berbeza pada momen dan nod yang berbeza kepada mewakili perubahan dalam perwakilan produk (jenis N*T, N: jenis nod; T: ruang masa), ruang fungsi yang berbeza juga disediakan untuk momen yang berbeza dan jenis tepi yang berbeza untuk mewakili ruang laluan penyebaran maklumat (R*T jenis, R: jenis tepi; T : masa dan ruang), dan akhirnya terdapat kaedah pengagregatan R*T*T apabila nod dan jiran diagregatkan (dua T ialah cap waktu nod pada kedua-dua hujung tepi.

Jelas sekali keseluruhan ruang carian adalah besar Kami cuba mengehadkan ruang parameter dan menggunakan teknologi pembelajaran mesin automatik untuk membina supernet supaya model boleh mencari seni bina rangkaian yang optimum. Kaedah khusus: hadkan bilangan ruang fungsi N*T kepada K_N, data ruang fungsi R*T kepada K_R, dan panjang modul R*T*T kepada K_Lo Sebagai contoh, N=6, T=30 , teorinya ialah N*T=180 ruang fungsi, had sebenar ialah K_N=10.

Algoritma ini pada masa ini telah digunakan pada senario seperti "pengenalpastian penjual tiruan" dan "pengenalpastian pedagang berniat jahat dengan jualan barangan terhad", dan berbanding dengan algoritma arus perdana dalam industri, ia telah memperoleh keputusan SOTA. Untuk butiran, anda boleh menyemak kertas [ 2].

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

2. Grafik dinamik pembelajaran mantap

kerana sifat konfrontasi risiko , grafik dinamik perlu mempunyai keteguhan yang kuat, dan intipatinya ialah Saya berharap grafik dinamik dapat mempelajari beberapa corak penting Contohnya, corak penting subgraf contoh dalam rajah di bawah ialah peningkatan ais penjualan krim disebabkan cuaca Semakin panas, bukan lagi lemas.

Kami berharap pembelajaran yang mantap dapat menyelesaikan beberapa masalah anjakan pengedaran dalam graf dinamik kawalan risiko e-dagang:

(1) Mengimbangi ciri : Contohnya, jika anda terlalu bergantung pada ciri seperti maklumat pelanggaran sejarah, penarikan balik ahli bermasalah yang baru didaftarkan akan menjadi lemah ;

(2) Anjakan struktur : Contohnya, terlalu bergantung pada substruktur ketumpatan darjah ahli pengiklanan spam akan menyebabkan panggilan palsu aktif bagi ahli biasa; akan mengikuti proses pencegahan dan kawalan Perubahan tingkah laku yang ketara berlaku.

Dalam hal ini, kami mencadangkan algoritma DIDA Idea teras adalah seperti yang ditunjukkan dalam rajah di bawah: pelajari dua corak semasa mempelajari graf dinamik -. oren Corak penting yang diwakili dan corak tidak penting diwakili oleh hijau, hanya kehilangan (L) corak penting + varians kehilangan (Ldo) gabungan corak bukan penting digunakan sebagai kehilangan akhir yang dipelajari oleh model . Idea reka bentuk varians kehilangan (Ldo) gabungan corak tidak penting ialah: dengan mengandaikan bahawa a3 hijau dalam gambar adalah corak tidak penting, kemudian menggantikan a3 hijau ini dengan corak tidak penting yang lain seperti b3, c3, dsb. harus memperbaiki kehilangan (diskriminasi) kebolehan model) mempunyai sedikit impak. Oleh itu, kita boleh menambah varians kehilangan corak tidak penting kepada pembelajaran model, dan dalam peringkat ramalan akhir, hanya corak penting digunakan untuk pengelasan. Pada masa ini, algoritma ini telah dilaksanakan dalam senario kawalan risiko kandungan produk, dan kertas[3] juga telah disusun.

Amalan algoritma graf dalam sistem kawalan risiko Alibaba 5. Pertandingan ICDM2022: Pengesanan Produk Berisiko pada Peta E-dagang Berskala Besar

<.> "Persaingan ICDM2022: Pengesanan Produk Berisiko pada Graf E-dagang Berskala Besar" ialah pertandingan algoritma yang kami hos tahun ini, dan data yang diberikan ialah data yang tidak sensitif daripada senario sebenar. Akhirnya, saya juga mendapat inspirasi daripada kod dan laporan teknikal yang diserahkan:

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

(1) Pra-latihan yang diselia sendiri sangat membantu dalam meningkatkan kesan , tetapi ia perlu Pilih tugasan yang diselia sendiri yang sesuai; kepada kebimbangan tentang kebocoran label, Bahagian data ini telah dibuang, tetapi ia tidak jelas selepas berlatih pada data sebenar. Tekaan adalah bahawa rangkaian graf semasa hanya mencapai gabungan maklumat, tetapi belum mencapai penaakulan atau mempunyai keupayaan penaakulan yang lemah; Bilangan itu secara amnya telah dipertingkatkan, dan ia boleh disebarkan sekali dan diagregatkan beberapa kali pada masa yang sama.

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

6 Ringkasan dan pandangan tentang pelaksanaan algoritma graf

Digabungkan dengan kami. pengalaman, Kaedah pelaksanaan algoritma graf berikut diringkaskan:

(1) Rangka kerja/platform algoritma graf: Perlu ada rangka kerja algoritma graf untuk mengumpul teknologi dan terbaik amalan dan meningkatkan kebolehgunaan semula teknologi.

(2) Pemodelan separa automatik: Untuk meningkatkan kecekapan pemodelan, pada peringkat data kami lebih baik membersihkan dan meringkaskan media perhubungan yang mendasari data , beberapa komponen (komponen pemilihan MetaPath/MetaGraph, komponen pensampelan graf, komponen pengambilan vektor, dll.) boleh disediakan pada peringkat pemodelan untuk meningkatkan kecekapan pemodelan.

(3) Panggilan automatik: Ia boleh memanggil algoritma graf atau model graf secara automatik yang hanya bergantung pada sampel input Tidak perlu memahami model graf, yang adalah mudah untuk orang lain yang tidak biasa dengan algoritma graf, pelajar kawalan risiko menjalankan pengoptimuman dan penggunaan model, seperti pengenalan kumpulan, pemulihan produk, pemulihan pengguna yang berisiko, dsb.

(4) Perwakilan graf pengeluaran (diawasi sendiri): digunakan sebagai input modal yang berasingan ke dalam model, tanpa menjejaskan kaedah pemodelan asal, sangat dipertingkatkan Rajah senario aplikasi.

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

Pandangan kerja susulan:

( 1) Pembelajaran perwakilan penyeliaan kendiri graf berskala besar. Kami mempunyai beribu-ribu model risiko, kebanyakannya tidak menggunakan algoritma graf di atas, jadi langkah seterusnya kami ialah melakukan perwakilan penyeliaan sendiri graf berskala besar untuk mengembangkan julat aplikasi ciri graf dan membantu meningkatkan hasil perniagaan. Kerja ini mempunyai dua cabaran dalam kejuruteraan dan algoritma: Pertama, dari segi kejuruteraan, kami mempunyai sekurang-kurangnya berbilion-bilion nod dan berpuluh-puluh bilion tepi untuk pembelajaran berskala besar Kedua, dari segi algoritma, perwakilan graf mestilah bukan sahaja meliputi perkara biasa perwakilan perhubungan yang digunakan, Anda juga perlu mempelajari ciri-ciri struktur graf peringkat tinggi, yang sangat serba boleh dan boleh digunakan pada pelbagai senario.

(2) Terokai keupayaan penaakulan graf dalam senario kawalan risiko tertentu Pada masa ini, algoritma graf lebih kepada gabungan pengetahuan dan keupayaan penaakulan adalah agak lemah , tidak mampu menghadapi antagonisme risiko yang tinggi. Secara objektif kita memerlukan model kita untuk mempunyai kecerdasan yang kuat, jadi keupayaan penaakulan graf adalah sangat penting. Pada masa ini, ia dirancang untuk bergantung pada senario interaktif yang kaya dan kandungan komuniti Xianyu untuk meneroka algoritma.

(3) Lebih banyak penerokaan dan pelaksanaan dalam penyelidikan domain frekuensi dan kebolehtafsiran graf heterogen dinamik. Tujuan penyelidikan domain frekuensi adalah untuk mengetahui lebih banyak butiran tentang perubahan struktur graf dalam graf dinamik. Kebolehtafsiran membantu kami memahami sama ada algoritma telah benar-benar mempelajari ciri-ciri penting Di satu pihak, ia membantu kami meningkatkan algoritma, dan sebaliknya, ia juga boleh diberikan dengan lebih baik kepada pelajar perniagaan untuk pelaksanaan aplikasi.

Amalan algoritma graf dalam sistem kawalan risiko Alibaba

Kami juga memohon kerjasama akademik dalam arah penerokaan di atas, terutamanya dalam arah penaakulan graf. Pada masa yang sama, kami juga mengambil pelajar untuk algoritma graf pelajar yang berminat boleh menghubungi saya.

7. Rujukan

1 🎜>

2. Carian Seni Bina Neural Graf Heterogen Dinamik Rangkaian Neural Graf Di Bawah Anjakan Taburan Spatio-Temporal NeurIPS2022.

8. Sesi Soal Jawab

S1: Apakah cabaran khas bagi perwakilan graf bagi senario kawalan risiko, berbanding dengan perwakilan graf dalam bidang lain?

A1: Tiga cabaran utama: pertama, struktur graf adalah lemah dan kadar homogeniti adalah rendah, kedua, keteguhan graf, dalam senario kami Terutamanya untuk dinamik graf, hanyut pengedarannya masih sangat serius Terdapat satu lagi masalah Kepekatan risiko sampel hitam adalah sangat rendah 1:1w+, jadi sampel kami sangat tidak seimbang, itulah yang perlu kami selesaikan.

S2: Apakah model algoritma semasa pembelajaran bersekutu graf Adakah terdapat penyelesaian yang matang dalam industri? Adakah anda mempunyai sebarang aplikasi atau pertimbangan untuk pembelajaran bersekutu graf?

J2: Kami masih menggunakannya terutamanya dalam senario e-dagang kami. Sudah tentu kami juga mempunyai beberapa perniagaan bukan e-dagang, tetapi data ini adalah milik kami masih Ia boleh digunakan secara langsung untuk kawalan risiko, jadi pembelajaran bersekutu belum digunakan lagi, tetapi masih perlu menggunakan pembelajaran bersekutu graf kemudian, kerana data sedang dipotong dan diasingkan untuk keselamatan maklumat, dan data daripada domain yang berbeza tidak boleh disambungkan dan digunakan , jadi pembelajaran bersekutu graf harus menjadi hala tuju aplikasi untuk kita terokai kemudian.

Atas ialah kandungan terperinci Amalan algoritma graf dalam sistem kawalan risiko Alibaba. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini

Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Penyingkiran pakaian AI

AI Hentai Generator

Menjana ai hentai secara percuma.

Tunjukkan Lagi

Artikel Panas

R.E.P.O. Kristal tenaga dijelaskan dan apa yang mereka lakukan (kristal kuning)

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Tetapan grafik terbaik

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Penyelesaian Riddle Seashell

2 minggu yang lalu By DDD

R.E.P.O. Cara Memperbaiki Audio Jika anda tidak dapat mendengar sesiapa

3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

WWE 2K25: Cara Membuka Segala -galanya Di Myrise

4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Tunjukkan Lagi

Alat panas

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Tunjukkan Lagi

Topik panas

Di manakah pintu masuk log masuk untuk e-mel gmail?

7486

Tutorial CakePHP

1377

Apakah format nama akaun stim

kunci pengaktifan win11 kekal

Sambungan NYT menunjukkan dan jawapan

Tunjukkan Lagi

Related knowledge

CLIP-BEVFormer: Selia secara eksplisit struktur BEVFormer untuk meningkatkan prestasi pengesanan ekor panjang Mar 26, 2024 pm 12:41 PM

Ditulis di atas & pemahaman peribadi penulis: Pada masa ini, dalam keseluruhan sistem pemanduan autonomi, modul persepsi memainkan peranan penting Hanya selepas kenderaan pemanduan autonomi yang memandu di jalan raya memperoleh keputusan persepsi yang tepat melalui modul persepsi boleh Peraturan hiliran dan. modul kawalan dalam sistem pemanduan autonomi membuat pertimbangan dan keputusan tingkah laku yang tepat pada masanya dan betul. Pada masa ini, kereta dengan fungsi pemanduan autonomi biasanya dilengkapi dengan pelbagai penderia maklumat data termasuk penderia kamera pandangan sekeliling, penderia lidar dan penderia radar gelombang milimeter untuk mengumpul maklumat dalam modaliti yang berbeza untuk mencapai tugas persepsi yang tepat. Algoritma persepsi BEV berdasarkan penglihatan tulen digemari oleh industri kerana kos perkakasannya yang rendah dan penggunaan mudah, dan hasil keluarannya boleh digunakan dengan mudah untuk pelbagai tugas hiliran.

Melaksanakan Algoritma Pembelajaran Mesin dalam C++: Cabaran dan Penyelesaian Biasa Jun 03, 2024 pm 01:25 PM

Cabaran biasa yang dihadapi oleh algoritma pembelajaran mesin dalam C++ termasuk pengurusan memori, multi-threading, pengoptimuman prestasi dan kebolehselenggaraan. Penyelesaian termasuk menggunakan penunjuk pintar, perpustakaan benang moden, arahan SIMD dan perpustakaan pihak ketiga, serta mengikuti garis panduan gaya pengekodan dan menggunakan alat automasi. Kes praktikal menunjukkan cara menggunakan perpustakaan Eigen untuk melaksanakan algoritma regresi linear, mengurus memori dengan berkesan dan menggunakan operasi matriks berprestasi tinggi.

Terokai prinsip asas dan pemilihan algoritma bagi fungsi isihan C++ Apr 02, 2024 pm 05:36 PM

Lapisan bawah fungsi C++ sort menggunakan isihan gabungan, kerumitannya ialah O(nlogn), dan menyediakan pilihan algoritma pengisihan yang berbeza, termasuk isihan pantas, isihan timbunan dan isihan stabil.

Bolehkah kecerdasan buatan meramalkan jenayah? Terokai keupayaan CrimeGPT Mar 22, 2024 pm 10:10 PM

Konvergensi kecerdasan buatan (AI) dan penguatkuasaan undang-undang membuka kemungkinan baharu untuk pencegahan dan pengesanan jenayah. Keupayaan ramalan kecerdasan buatan digunakan secara meluas dalam sistem seperti CrimeGPT (Teknologi Ramalan Jenayah) untuk meramal aktiviti jenayah. Artikel ini meneroka potensi kecerdasan buatan dalam ramalan jenayah, aplikasi semasanya, cabaran yang dihadapinya dan kemungkinan implikasi etika teknologi tersebut. Kecerdasan Buatan dan Ramalan Jenayah: Asas CrimeGPT menggunakan algoritma pembelajaran mesin untuk menganalisis set data yang besar, mengenal pasti corak yang boleh meramalkan di mana dan bila jenayah mungkin berlaku. Set data ini termasuk statistik jenayah sejarah, maklumat demografi, penunjuk ekonomi, corak cuaca dan banyak lagi. Dengan mengenal pasti trend yang mungkin terlepas oleh penganalisis manusia, kecerdasan buatan boleh memperkasakan agensi penguatkuasaan undang-undang

Algoritma pengesanan yang dipertingkatkan: untuk pengesanan sasaran dalam imej penderiaan jauh optik resolusi tinggi Jun 06, 2024 pm 12:33 PM

01Garis prospek Pada masa ini, sukar untuk mencapai keseimbangan yang sesuai antara kecekapan pengesanan dan hasil pengesanan. Kami telah membangunkan algoritma YOLOv5 yang dipertingkatkan untuk pengesanan sasaran dalam imej penderiaan jauh optik resolusi tinggi, menggunakan piramid ciri berbilang lapisan, strategi kepala pengesanan berbilang dan modul perhatian hibrid untuk meningkatkan kesan rangkaian pengesanan sasaran dalam imej penderiaan jauh optik. Menurut set data SIMD, peta algoritma baharu adalah 2.2% lebih baik daripada YOLOv5 dan 8.48% lebih baik daripada YOLOX, mencapai keseimbangan yang lebih baik antara hasil pengesanan dan kelajuan. 02 Latar Belakang & Motivasi Dengan perkembangan pesat teknologi penderiaan jauh, imej penderiaan jauh optik resolusi tinggi telah digunakan untuk menggambarkan banyak objek di permukaan bumi, termasuk pesawat, kereta, bangunan, dll. Pengesanan objek dalam tafsiran imej penderiaan jauh

Amalkan dan fikirkan platform model besar berbilang modal Jiuzhang Yunji DataCanvas Oct 20, 2023 am 08:45 AM

1. Perkembangan sejarah model besar pelbagai mod Gambar di atas adalah bengkel kecerdasan buatan pertama yang diadakan di Kolej Dartmouth di Amerika Syarikat pada tahun 1956. Persidangan ini juga dianggap telah memulakan pembangunan kecerdasan buatan perintis logik simbolik (kecuali ahli neurobiologi Peter Milner di tengah-tengah barisan hadapan). Walau bagaimanapun, teori logik simbolik ini tidak dapat direalisasikan untuk masa yang lama, malah memulakan musim sejuk AI pertama pada 1980-an dan 1990-an. Sehingga pelaksanaan model bahasa besar baru-baru ini, kami mendapati bahawa rangkaian saraf benar-benar membawa pemikiran logik ini. Kerja ahli neurobiologi Peter Milner memberi inspirasi kepada pembangunan rangkaian saraf tiruan yang seterusnya, dan atas sebab inilah dia dijemput untuk mengambil bahagian. dalam projek ini.

Aplikasi algoritma dalam pembinaan 58 platform potret May 09, 2024 am 09:01 AM

1. Latar Belakang Pembinaan 58 Portrait Platform Pertama sekali, saya ingin berkongsi dengan anda latar belakang pembinaan 58 Portrait Platform. 1. Pemikiran tradisional platform pemprofilan tradisional tidak lagi mencukupi Membina platform pemprofilan pengguna bergantung pada keupayaan pemodelan gudang data untuk menyepadukan data daripada pelbagai barisan perniagaan untuk membina potret pengguna yang tepat untuk memahami tingkah laku, minat pengguna dan keperluan, dan menyediakan keupayaan sampingan, akhirnya, ia juga perlu mempunyai keupayaan platform data untuk menyimpan, bertanya dan berkongsi data profil pengguna dan menyediakan perkhidmatan profil dengan cekap. Perbezaan utama antara platform pemprofilan perniagaan binaan sendiri dan platform pemprofilan pejabat pertengahan ialah platform pemprofilan binaan sendiri menyediakan satu barisan perniagaan dan boleh disesuaikan atas permintaan platform pertengahan pejabat berkhidmat berbilang barisan perniagaan, mempunyai kompleks pemodelan, dan menyediakan lebih banyak keupayaan umum. 2.58 Potret pengguna latar belakang pembinaan potret di platform tengah 58

Tambah SOTA dalam masa nyata dan meroket! FastOcc: Inferens yang lebih pantas dan algoritma Occ mesra penggunaan sudah tersedia! Mar 14, 2024 pm 11:50 PM

Ditulis di atas & Pemahaman peribadi penulis ialah dalam sistem pemanduan autonomi, tugas persepsi adalah komponen penting dalam keseluruhan sistem pemanduan autonomi. Matlamat utama tugas persepsi adalah untuk membolehkan kenderaan autonomi memahami dan melihat elemen persekitaran sekeliling, seperti kenderaan yang memandu di jalan raya, pejalan kaki di tepi jalan, halangan yang dihadapi semasa memandu, tanda lalu lintas di jalan raya, dan sebagainya, dengan itu membantu hiliran. modul Membuat keputusan dan tindakan yang betul dan munasabah. Kenderaan dengan keupayaan pemanduan autonomi biasanya dilengkapi dengan pelbagai jenis penderia pengumpulan maklumat, seperti penderia kamera pandangan sekeliling, penderia lidar, penderia radar gelombang milimeter, dsb., untuk memastikan kenderaan autonomi itu dapat melihat dan memahami persekitaran sekeliling dengan tepat. elemen , membolehkan kenderaan autonomi membuat keputusan yang betul semasa pemanduan autonomi. kepala

See all articles