Dalam beberapa tahun kebelakangan ini, dengan perubahan dalam keperluan pengiklan dan perkembangan teknologi yang berkaitan, teori ekonomi pengiraan, teori permainan dan teknologi kecerdasan buatan telah semakin digunakan pada mekanisme lelongan pengiklanan dan strategi penyampaian.
Kepentingan risikan membuat keputusan dalam senario perniagaan telah beransur-ansur menjadi jelas. Setiap paparan produk yang dilihat pengguna, setiap bida pengiklanan oleh pedagang, dan setiap peruntukan trafik pada platform disokong oleh kecerdasan membuat keputusan yang besar dan kompleks.
Matlamat tindakan ini adalah untuk mengoptimumkan pengalaman membeli-belah pengguna, menjadikan proses membuat keputusan pengiklanan lebih bijak dan pada masa yang sama membolehkan pengiklan dan media mencapai jangka panjang kemakmuran di platform. Pengiklan berharap untuk memaksimumkan kesan pemasaran dengan pelaburan sumber yang terhad, dan platform berharap dapat membina ekosistem yang lebih baik. Walau bagaimanapun, kerumitan persekitaran trafik, persekitaran persaingan yang dibentuk oleh iklan pesaing lain, dan kerumitan besar gabungan pembolehubah seperti bida, kumpulan sasaran, lokasi sumber dan masa penghantaran dalam strategi pengiklanan membuat pengiraan dan pelaksanaan strategi pengiklanan yang optimum penuh dengan cabaran.
Bagaimana untuk menyelesaikan masalah ini? Bagaimanakah matlamat memaksimumkan faedah dipecahkan? Isu-isu penting yang berkaitan dengan risikan membuat keputusan ini juga menjadi kebimbangan yang paling besar kepada penyelidik dan pengamal di lapangan.
Untuk meneroka secara mendalam tema "Kecerdasan Keputusan dalam Senario Perniagaan Perisikan Digital", Alimama Boxian Society and Heart of Machines baru-baru ini menjemput Profesor Deng Xiaotie dari Universiti Peking dan Cai Shaowei dari Penyelidik Akademi Sains China dan Alimama CTO Zheng Bo, tiga sarjana kanan dan pakar dalam bidang itu, melancarkan satu siri perkongsian tema.
Berikut ialah kandungan perkongsian tema Profesor Deng Xiaotie, Penyelidik Cai Shaowei, dan Cikgu Zheng Bo The Heart of the Machine telah menyusunnya tanpa mengubah maksud asal.
Hari ini saya akan memperkenalkan secara ringkas ekonomi pengiraan, yang merupakan bidang penyelidikan dengan sejarah yang panjang hingga 1930. Ekonomi pengiraan kemudiannya bermula dari perspektif lain dan menukar ekonomi kepada pengiraan Ekonomi pengiraan sebelum ini adalah melakukan penyelidikan ekonomi melalui pengiraan.
Apabila kita berfikir tentang ekonomi dari perspektif pengiraan, terdapat beberapa isu utama: Yang pertama ialah pengoptimuman pembelajaran mesin semuanya, daripada yang kita boleh Melihat banyak sistem pengoptimuman. Selepas pengoptimuman, terdapat satu lagi isu yang dipanggil keseimbangan Pada masa lalu, apabila kita melakukan ekonomi pengiraan, kita melakukannya dari perspektif ekonomi terancang Tetapi pada masa itu, terdapat juga sekolah yang mengusahakan pembangunan negara-negara membangun Bank Dunia Mereka membuat rancangan untuk negara-negara membangun Idea mengoptimumkan input dan output dibangunkan. Mengira keseimbangan dari perspektif pengiraan boleh menjadi masalah yang sangat sukar, jadi konsep yang dipanggil keseimbangan am boleh dikira telah muncul.
Baru-baru ini, kita dapat melihat semakin banyak sistem yang dinamik, kerana banyak perkara di dunia ini tidak berada dalam keseimbangan, dan suasana keseimbangan amat menonjol dalam aktiviti ekonomi digital , termasuk perkara di tahap ekonomi, seperti harga. Dalam ekonomi digital, data transaksi dan turun naik harga dapat dilihat setiap saat. Kita boleh melihat dengan jelas perubahan dalam data, bukannya hanya mengira data ekonomi selepas setahun berlalu.
Terdapat banyak lagi dalam rangka kerja keseluruhan ekonomi pengiraan. Setiap entiti ekonomi mesti mengoptimumkan, dan titik tetap permainan bersama mereka adalah keseimbangan. Platform juga akan memainkan permainan keseimbangan, terutamanya platform pengiklanan Internet Pengiklan datang ke platform dan mengedarkan iklan mereka melalui platform dan media. Bagi media, adalah perlu untuk menyediakan kedudukan pengiklanan dan menggunakan tarikan mereka sendiri kepada jenis orang tertentu. Untuk platform, perkara yang perlu kita fikirkan ialah cara memadankan minat semua orang dengan lebih baik. Sebagai platform pengiklanan terbesar di China, Alimama juga menghadapi masalah keseimbangan permainan Ia perlu mengatur kepentingan semua pihak untuk memaksimumkan faedah sosial dan memaksimumkan faedah reka bentuk mekanisme.
Kita boleh bercakap tentang pengoptimuman daripada tiga perspektif.
Pertama ialah isu pencirian kecerdasan ekonomi. Banyak perkara pembelajaran mesin ditulis sebagai masalah pengoptimuman, seperti cara menggunakan kaedah pembelajaran mesin untuk mengira kekangan, termasuk kekangan dalam sesetengah persekitaran.
Di bawah maklumat yang tidak lengkap, banyak syarat yang tidak diketahui Ekonomi asal tidak boleh mempertimbangkan perkara yang rumit seperti itu, seperti apakah fungsi faedah lawan permainan dan ruang strategi lawan permainan. Apa itu, apakah lawan permainan, dan maklumat yang tidak sempurna juga sangat penting dalam menggambarkan aktiviti ekonomi.
Banyak andaian boleh menerangkan maklumat yang tidak lengkap, seperti orang ekonomi mengetahui fungsi faedah lawan, kekangan dan pelbagai maklumat lain. Terdapat pengetahuan umum tentang fungsi faedah masing-masing: kita tahu pengagihan. Tetapi dari mana datangnya pengedaran ini? Ini membawa kita ke alam pembelajaran mesin: mengapa pemain memberitahu satu sama lain dan kita apa yang diketahuinya? Memandangkan ini, terdapat beberapa soalan yang sangat munasabah dari segi sudut pengiraan.
Dinamik permainan, ini adalah langkah ketiga ekonomi pengiraan. Dari perspektif ekonomi ekonomi sebenar, banyak aktiviti telah berkembang dan berkembang selama 6,000 tahun, dan setiap orang perlahan-lahan bermain permainan sehingga keseimbangan dicapai. Dalam ekonomi digital, ia akan menjadi satu cabaran besar untuk mencapai keseimbangan sekaligus.
Pengoptimuman platform pengiklanan ialah perkara yang Alimama lakukan. Kami telah membincangkan begitu banyak tugas pengkomputeran yang sukar, bilakah kami akan dapat melakukannya dengan baik? Dalam kes parameter tunggal, teori sedia ada boleh menyokongnya, tetapi tiada definisi siap sedia dalam teori untuk cara mencapai berbilang parameter.
Perkara yang sangat penting ialah keseluruhan sistem ekonomi telah diwujudkan, tetapi penerapan ekonomi ke Internet akan menyebabkan kecacatan besar - ia adalah statik. Semua orang mesti tahu bahawa perkara dalam industri tidak statik Contohnya, promosi "Double Eleven" akan mewujudkan banyak cabaran Bagaimana untuk mereka bentuk harga sampul merah dan cara membina perkara ini berdasarkan model pasaran yang diketahui telah menjadi isu penting ekonomi pengiraan hari ini Cabaran: Satu ialah pengoptimuman penyelesaian anggaran, satu ialah perancangan keseimbangan, dan satu lagi ialah dinamik persaingan platform.
Pengiraan anggaran adalah sangat sukar. kebanyakan. , iaitu 33% berbeza daripada optimum, jadi pengiraan keseimbangan memang sukar. Metodologi reka bentuk automatik dan pembelajaran model lawan tersembunyi adalah rangka kerja dalam bidang ini, dan semuanya berkaitan dengan kapasiti maklumat.
Yang lain ialah berjudi dengan lawan yang tidak dikenali di pasaran. Kami perlu mempertimbangkan sekurang-kurangnya dua syarikat dan membina model untuk mereka bentuk permainan di antara mereka Semuanya membosankan dan tidak semua maklumat diketahui. Berdasarkan maklumat yang diketahui, kami melihat turun naik pasaran dan perubahan reka bentuk harga Berdasarkan ini, kami mereka bentuk model pengoptimuman fungsi tersirat dan menggunakan kaedah pembelajaran mesin untuk analisis.
Tertib kognisi berbilang pihak membawa kita tahap kognitif permainan. Dalam beberapa tahun kebelakangan ini, beberapa kajian telah membincangkan banyak sebab mengapa lelongan harga pertama lebih baik daripada lelongan harga kedua. Myerson membangunkan teori lelongan optimum dengan mengandaikan bahawa semua orang mengetahui pengagihan nilai setiap orang, tetapi kami sebenarnya tidak mengetahui pengetahuan umum. Penyelidikan kami sendiri dipertimbangkan dari perspektif lain Titik permulaan adalah bahawa tidak ada pengetahuan umum apriori, dan andaian asal untuk mewujudkan teori lelongan optimum Myerson menggunakan kaedah probabilistik ditinggalkan.
Dengan ketiadaan andaian asas keseimbangan lelongan ini, bagaimanakah penyelesaian optimum boleh mencapai keseimbangan? Ia boleh didapati bahawa hasil lelongan satu harga umum adalah sama dengan Myerson. Di sini, kita harus berurusan dengan pengagihan nilai yang diumumkan oleh pembeli dengan faedah optimum kerana matlamat pulangan optimum Myerson yang direka oleh penjual adalah bersamaan dengan pulangan lelongan yang dijangkakan bagi lelongan satu harga yang umum.
Kesimpulan akhir ialah Myerson dan GFP adalah setara, ia lebih baik daripada VCG, tetapi ia setara dalam kes IID, Symmetric BNE dan GSP juga setara.
Konsep lain yang digunakan dalam ekonomi pengiraan ialah permainan Markov, permainan dalam persekitaran yang dinamik, terutamanya masalah menyelesaikan permainan pusingan tak terhingga. Kami menangani masalah dari tiga arah: pertama, memudahkan pengiraan secara rasional dan mengehadkan matlamat kepada penyelesaian anggaran kedua, menggunakan kadar diskaun masa untuk memastikan penumpuan pulangan pusingan tak terhingga ketiga, analisis matematik Tahap penjumlahan mengehadkan perubahan dalam strategi; dalam pusingan yang berbeza kepada perubahan dalam satu pusingan. Dengan cara ini, kesukaran penjumlahan tak terhingga dapat diatasi.
Kami memudahkan lagi kesukaran pengiraan dalam aplikasi permainan Markov. Terdapat analisis ganjaran Markov yang jelas untuk reka bentuk mekanisme konsensus, dan ia menceritakan kisah yang baik. Mengikut peraturan reka bentuk mekanisme, adalah tepat jika kebanyakan orang menyokongnya. Tetapi kemudiannya didapati bahawa sokongan majoriti tidak menjamin keselamatan ekonomi.
Bagi masalah dalam proses reka bentuk ekonomi digital, kerja terbaru kami adalah menggunakan Keseimbangan perlombongan Berwawasan untuk mengatasinya dan menggunakan strategi berpandangan jauh untuk mencapai optimum Akhirnya struktur permainan Markov yang membentuk proses ganjaran Markov, menambah tahap kognitif, dari kolam perlombongan yang jujur, kolam perlombongan yang mementingkan diri sendiri, dan kemudian melintasi tahap lain untuk mencapai hasil kolam perlombongan yang berwawasan. .
Begitu juga, banyak syarikat Internet perlu berurusan dengan perkara yang dinamik berbanding perkara yang statik. Ekonomi dunia hari ini bukan lagi ekonomi masa lalu bersepadu rapat. Oleh itu, kita telah mengatasi situasi yang hanya mampu menangani ekonomi statik dan berkembang menjadi mampu menangani situasi dinamik.
Penyelidik Cai Shaowei: Kaedah yang cekap untuk menyelesaikan masalah pengoptimuman gabungan jarang berskala besar
Helo semua, topik yang saya kongsikan hari ini adalah besar -skala Kaedah yang cekap untuk pengoptimuman gabungan yang jarang. Teras kepada banyak masalah membuat keputusan melibatkan masalah pengoptimuman gabungan, dan orang ramai sangat mengambil berat tentang cara memilih gabungan penyelesaian yang sesuai untuk mencapai pengoptimuman matlamat.
Terdapat dua jenis kaedah utama untuk menyelesaikan pengoptimuman gabungan: satu ialah kaedah heuristik, termasuk carian heuristik dan pembinaan heuristik Contohnya, algoritma tamak yang sering digunakan oleh semua orang boleh dianggap sebagai heuristik Satu jenis pembinaan, kriteria tamak ialah heuristik;
Kelebihan kaedah heuristik ialah ia tidak sensitif kepada skala, jadi ia boleh menyelesaikan masalah berskala besar dengan anggaran jurang adalah antara penyelesaian pemisahan optimum yang diperolehi, atau anda mungkin telah menemui penyelesaian optimum, tetapi anda tidak mengetahuinya. Branch And Bound selesai Jika anda memberi masa yang cukup untuk mengira sehingga ia berhenti, anda boleh mencari penyelesaian yang optimum dan membuktikan bahawa ia adalah penyelesaian yang optimum. Walau bagaimanapun, kaedah ini datang pada kos dan sensitif kepada skala, kerana jenis algoritma ini meletup secara eksponen dan selalunya tidak sesuai untuk masalah berskala besar.
Sama ada ia sedang mencari atau membina, rangka kerja algoritma heuristik kebanyakannya sangat mudah, dan ia bergantung terutamanya pada cara heuristik itu direka bentuk dan kriteria mana ia harus berdasarkan. Kaedah cawangan dan terikat terutamanya memberi tumpuan kepada cara membuat "batasan".
Nanti saya fikir, boleh ke kita gabungkan kedua-duanya? Dalam erti kata lain, ia bukan sahaja boleh kekal tidak sensitif terhadap skala, tetapi juga menambah teknologi yang mengikat. Adalah mudah untuk berfikir bahawa anda boleh menggunakan kaedah prapemprosesan, atau lakukan Heuristik dahulu dan kemudian Branch And Bound, dan menggunakan keputusan Heuristik sebagai penyelesaian awal, dsb. Kami mencadangkan pendekatan baharu dalam hal ini - lelaran bersarang dalam Heuristik dan Branch And Bound.
Ringkasnya, kaedah ini terlebih dahulu melakukan penyelesaian Heuristik kasar untuk mencari keputusan awal. Secara umumnya, sempadan atas dan bawah diperlukan untuk pembatasan secara kasar akan memperoleh sempadan bawah, dan kemudian mereka bentuk fungsi untuk sempadan atas. Dengan mengandaikan bahawa masalah itu agak besar dan merangkumi banyak elemen, kita boleh menghapuskan beberapa untuk menjadikan masalah lebih kecil. Kemudian menjadi lebih halus dan teruskan melakukan penyelesaian Heuristik, yang mungkin meningkatkan batas bawah. Atas dasar ini, algoritma boleh melakukan lebih banyak sempadan dan terus bersarang. Jadi algoritma ini menjadi algoritma separa tepat, dan adalah mungkin untuk membuktikan bahawa ini adalah penyelesaian yang optimum, kerana pada langkah tertentu didapati ruang masalah adalah cukup kecil, dan ia tidak memerlukan penyelesaian Heuristik tetapi boleh diselesaikan secara langsung dan tepat. Di samping itu, jika penyelesaian optimum tidak dijumpai, anda juga boleh mengetahui di mana selang penyelesaian optimum.
Berikut akan memberikan dua contoh untuk menerangkan kaedah ini.
Yang pertama ialah "masalah kumpulan maksimum". Clique adalah konsep yang sangat klasik dalam teori graf Dalam graf, terdapat subgraf yang disambungkan oleh tepi antara titik, yang dipanggil clique Masalah maksimum adalah untuk mencari clique terbesar. Jika anda memberikan pemberat dan memberikan pemberat pada setiap bucu, masalah klik wajaran maksimum ialah mencari klik dengan jumlah berat terbesar. Dalam contoh di bawah, masing-masing terdapat empat kumpulan dan tiga kumpulan Berat kumpulan tiga adalah lebih besar, iaitu kumpulan wajaran terbesar dalam gambar ini.
Untuk melakukan ini mengikut rangka kerja ini, kita memerlukan dua sub-algoritma, satu untuk penyelesaian heuristik, dipanggil FindClique dalam kumpulan, dan satu lagi Ia adalah algoritma penyederhanaan yang dipanggil ReduceGraph. Kami boleh menggunakan FindClique untuk mencari kumpulan yang lebih baik daripada yang kami temui sebelum ini. Apabila rumpun yang lebih baik ini mencapai Graf Kurangkan, apa yang kita tahu ialah: rumpun terbesar sekurang-kurangnya sebesar ini. Penyederhanaan juga dilakukan pada langkah ini Jika graf menjadi kosong selepas penyederhanaan, maka kluster yang ditemui adalah penyelesaian optimum jika ia tidak menjadi kosong, maka anda boleh mengurangkan beberapa titik dan kembali untuk melaraskan algoritma untuk mencari kluster. Algoritma di sini tidak semestinya algoritma tetap dan boleh berubah secara dinamik.
Salah satu kerja kami memilih kaedah "bina dan potong", yang boleh difahami sebagai algoritma rakus berbilang.
Kesan daripada pelbagai binaan tamak ialah setiap pembinaan tamak boleh menjadi sangat pantas dan boleh bermula dari titik permulaan yang berbeza, dan jika semasa pembinaan tertentu proses Selepas mengira, tidak kira berapa banyak kumpulan semasa berkembang, adalah mustahil untuk melebihi kumpulan yang ditemui sebelum ini, kita boleh berhenti. Matlamat utama adalah untuk mencari kumpulan yang lebih besar daripada sebelumnya Sama ada heuristik harus dibuat lebih halus dan cara menyesuaikan susunan bergantung pada skala graf Ia seperti mengupas bawang pada lapisan tertentu supaya ada Tumpuan yang lebih besar untuk mencari pasukan yang lebih baik. Apabila graf tidak dapat dipermudahkan lagi, kita boleh menggunakan algoritma yang tepat seperti Branch And Bound. Selepas mencari kluster, mengikut kaedah kami, kami perlu melakukan pembatasan dan membuang beberapa titik Kaedahnya adalah untuk menganggarkan saiz kluster yang boleh dibangunkan oleh mata, dan mungkin terdapat penyelesaian yang berbeza untuk menyelesaikannya.
Kedua-dua teknik anggaran sempadan ini adalah contoh dan anda boleh menggunakan teknik yang berbeza untuk melakukannya. Dari segi percubaan, anda boleh merujuk kepada jadual di bawah untuk membandingkan kaedah seperti FastWClq, LSCC+BMS dan MaxWClq Masa yang diperlukan untuk mencapai ketepatan yang sama berbeza lebih daripada sepuluh atau bahkan ratusan kali.
Mari kita lihat soalan kedua: "Masalah pewarna graf". Apa yang dipanggil mewarna adalah untuk melukis setiap titik graf dengan warna Dua titik bersebelahan tidak boleh sama warna Masalah pewarnaan graf membincangkan bilangan minimum warna yang boleh digunakan untuk mewarnakan graf minimum dipanggil nombor warna graf. Masalah pewarnaan graf mempunyai banyak aplikasi, terutamanya memperuntukkan sumber tanpa konflik.
Idea umum masalah ini adalah sama - penyelesaian heuristik serta beberapa teknik terikat. Perbezaannya ialah masalah pewarnaan graf tidak memerlukan subset Memandangkan keseluruhan graf perlu diwarnakan, tiada konsep "membuangnya selama-lamanya". warna. Pengurangan di sini adalah untuk menguraikan graf kepada Kernel dan Margin:
Terdapat peraturan yang sangat mudah, yang masih berkaitan dengan set bebas Saya tahu ini Bilangan warna minimum yang perlu digunakan oleh graf ialah warna sempadan bawah (ditandakan sebagai ℓ), dan kemudian set bebas sempadan ℓ-darjah boleh ditemui. Darjah titik dalam set bebas ini semuanya lebih kecil daripada ℓ, jadi ia dipanggil terikat ℓ-darjah. Jika anda menemui set bebas sedemikian, anda boleh mengalihkannya ke Margin dengan selamat. Jika penyelesaian kernel ditemui, kita boleh menggabungkan margin ke dalamnya dengan mudah Jika kernel adalah penyelesaian optimum, gabungan juga mestilah penyelesaian optimum Peraturan ini boleh digunakan secara berulang.
Mari lihat contoh Empat titik kelabu dalam contoh ini anda boleh melihat bahawa sekurang-kurangnya 4 warna diperlukan. Tiga mata di sebelahnya diletakkan di tepi Memandangkan darjah tiga mata adalah lebih kecil daripada 4, kita boleh mengalihkan ketiga-tiga mata ini ke tepi dan mengabaikannya buat masa ini. Kemudian saya mendapati bahawa subgraf yang selebihnya tidak boleh diuraikan Ia sudah sangat tegar dan boleh diselesaikan secara langsung. Inti keras graf jarang biasanya tidak besar, jadi algoritma yang tepat boleh dipertimbangkan untuk penyelesaian. Jika anda menemui teras, diketahui bahawa teras menggunakan sekurang-kurangnya empat warna Untuk titik di tepi, darjah setiap titik adalah kurang daripada 4. Bagaimana anda boleh meninggalkan warna untuknya? masa.
Sehingga akhir, margin setiap kulit mesti dikekalkan, dan lapisan mesti ditanda dengan jelas Ini berkaitan dengan soalan pertama Sedikit tempat yang berbeza. Kita perlu menggunakan struktur data tambahan untuk mengekalkan peta tepi ini Selepas Kernel tidak boleh alih terakhir diselesaikan dengan tepat, kita boleh menggunakan kaedah terbalik untuk menggabungkan Margin terakhir dan mengekalkan keoptimuman mengikut peraturan sebelumnya , menggabungkan kelebihan masih akan menjadi optimum Jika anda kembali sepanjang jalan, penyelesaian kepada imej asal juga mesti optimum.
Apabila masalah ini dibingkaikan, yang tinggal hanyalah mempertimbangkan cara mencari sempadan bawah dan sempadan atas. Idea umum algoritma ialah: pada mulanya, kernel adalah imej asal, dan algoritma klik maksimum perlu digunakan untuk mencari sempadan bawah; selepas mengelupas tepi, algoritma pewarnaan graf tamak boleh digunakan untuk mencari sempadan atas.
Sebenarnya terdapat tiga algoritma yang digunakan di sini. Dalam amalan, kaedah tebukan gabungan adalah lebih biasa, khususnya untuk pewarnaan kernel Apabila imej agak besar, kita mungkin melakukannya melalui beberapa kaedah yang tamak atau lebih pantas, dan akhirnya ia mungkin menjadi algoritma yang tepat untuk melakukannya. Sepanjang proses, sempadan bawah dan sempadan atas adalah global Jika kedua-dua ini sama, anda boleh berhenti.
Gambar di atas adalah hasil percubaan dilihat bahawa dalam jarang Kesan pada gambar besar adalah lebih baik, 97 daripada 144 boleh membuktikan penyelesaian optimum dalam satu minit. Berbanding dengan algoritma yang serupa, masa perbandingan algoritma kami juga lebih cepat Terdapat kaedah khas pada graf besar yang agak jarang yang boleh menyelesaikan masalah dengan cepat. Dulu orang berfikir bahawa masalah NP-hard dengan berjuta-juta bucu mesti mengambil masa yang lama untuk diselesaikan. Sebenarnya, jika graf ini besar tetapi mempunyai ciri-ciri tertentu, kita masih boleh menyelesaikannya dalam beberapa saat dan minit.
Alimama CTO Zheng Bo: Sistem teknologi perisikan pembuatan keputusan Alimama yang sentiasa dinaik taraf
Helo semua, sebagai pengarah teknikal Alimama, saya akan berkongsi ini dari perspektif industri Alimama telah mencapai kemajuan dalam teknologi risikan membuat keputusan dalam beberapa tahun yang lalu.
Ditubuhkan pada 2007, Alimama ialah jabatan pengkomersilan teras Kumpulan Alibaba, iaitu jabatan pengiklanan dalam talian. Selepas lebih daripada sepuluh tahun pembangunan, Alimama telah mencipta produk yang berpengaruh seperti "Search Advertising Taobao Express". pemasaran pada tahun 2016.
Dari sudut pandangan teknikal, sekitar 2015 dan 2016, Alimama menerima sepenuhnya pembelajaran mendalam, daripada enjin pemasaran pintar OCPX kepada yang dibangunkan sendiri The algoritma teras untuk ramalan CTR, model MLR, terus berkembang dengan kaedah pembelajaran mendalam. Pada tahun 2018, rangka kerja pembelajaran mendalam X-Deep Learning adalah sumber terbuka. Pada tahun 2019, rangka kerja pembelajaran graf Euler adalah sumber terbuka, dan pengesyoran hebat untuk produk aliran maklumat turut dilancarkan "Orang ramai mencari barangan" berkembang menjadi "barang mencari orang." Mulai tahun 2020, Alimama melancarkan pengiklanan penstriman langsung, dan juga mula melancarkan iklan insentif interaktif, seperti permainan interaktif "Double Eleven" Stacking Cat, yang dimainkan dengan lebih kerap. Rangka kerja pembelajaran ruang kelengkungan juga adalah sumber terbuka pada tahun ini.
Pada tahun 2022, Alimama membuat peningkatan besar pada keseluruhan enjin pengiklanan. Platform enjin pengiklanan EADS dan platform pengeluaran dan pemahaman multimedia MDL kedua-duanya dalam talian dari segi perlindungan privasi pengguna, keupayaan teknologi pengkomputeran privasi Alimama telah diperakui oleh Akademi Teknologi Maklumat dan Komunikasi China. Melihat kembali perkembangan Alimama sejak lima belas tahun yang lalu, kita dapat melihat bahawa kami adalah sebuah syarikat yang terlibat dalam pengiklanan pengiraan.
Apakah kelebihan Alimama? Dalam bidang e-dagang yang sangat profesional, kami mempunyai pemahaman yang sangat kuat tentang pengguna dan e-dagang, dan senario perniagaan juga sangat kaya Sebagai tambahan kepada carian dan pengesyoran tradisional, kami juga mempunyai senario perniagaan digital seperti siaran langsung promosi, interaksi dan bentuk baharu. Selain itu, pangkalan pelanggan kami adalah antara yang terbesar di dunia, dengan berjuta-juta pedagang menjadi pengiklan di platform Alimama. Pelanggan ini mempunyai banyak keperluan Selain keperluan perniagaan untuk operasi, terdapat juga pelbagai peranan ekologi yang terlibat, seperti sauh, pakar, ejen, dan penyedia perkhidmatan.
Kami juga mempunyai banyak penyelidikan dalam AI. Di sini kami memperkenalkan ciri-ciri teknologi algoritma adegan pengiklanan. Seperti yang ditunjukkan di atas, struktur corong terbalik di sebelah kiri sangat biasa kepada ramai pelajar yang melakukan carian atau pengesyoran Bahagian pengiklanan ini sangat serupa dengan pengesyoran carian, termasuk ingatan pengiklanan, pengisihan kasar, pengisihan halus dan pemarkahan strategi mekanisme. melibatkan sejumlah besar AI seperti teknologi perolehan semula, terutamanya model ingat semula seperti pemadanan TDM, semuanya menggunakan teknologi pembelajaran mendalam.
Ini termasuk kecerdasan membuat keputusan Memandangkan platform mengandungi banyak peranan, masing-masing mempunyai hubungan permainannya sendiri, kecerdasan membuat keputusan berguna antara hubungan berbilang pihak dan keseimbangan yang dioptimumkan. Pengalaman pengguna, kos trafik, hasil jangkaan, kawalan belanjawan dan penyepaduan merentas domain semuanya perlu seimbang.
Di sini saya akan bercakap tentang tiga pemain permainan biasa. Terdapat banyak pemain di platform, dan terdapat tiga kategori utama: media, pengiklan dan platform pengiklanan.
Teknologi teras ketiga-tiga bahagian ini boleh diringkaskan seperti berikut: dari perspektif media, fokus pada pengeluaran sumber media yang paling boleh mengimbangi pengalaman pengguna dan hasil komersial dari perspektif pengiklan, perkara yang perlu dioptimumkan dan bagaimana untuk menggunakan yang terkecil Mencapai matlamat pemasaran pada kos. Jadi, apakah matlamat terbesar platform pengiklanan? Dalam jangka masa panjang, matlamat peringkat rendah platform pengiklanan adalah untuk menjadikan keseluruhan platform lebih makmur Menjana wang hanyalah perkara jangka pendek, dan menjadikan platform itu makmur dalam jangka panjang adalah matlamat utama platform mesti mengimbangi hubungan antara semua pihak dan membenarkan pemain dari semua pihak untuk Senang bermain di platform.
Matlamat pengoptimuman platform pengiklanan melibatkan banyak reka bentuk mekanisme. Hari ini saya akan bercakap secara ringkas tentang tiga arah reka bentuk mekanisme lelongan pintar, strategi pembidaan pintar dan strategi pengkomersialan pintar Saya terutamanya akan bercakap tentang kerja Alimama dalam hal ini dalam beberapa tahun lalu dengan cara sains yang popular untuk dibincangkan oleh semua orang.
Reka bentuk mekanisme lelongan pintar.
Mari kita bincangkan tentang reka bentuk mekanisme lelongan pintar Ini adalah topik yang sangat menarik ramai warga emas dan pakar telah memenangi Hadiah Nobel. Mekanisme lelongan klasik yang kita bicarakan semuanya muncul sebelum tahun 1970-an Pada masa itu, pengiklanan dalam talian masih belum muncul, dan semua orang banyak mengkaji tentang pengoptimuman lelongan tunggal atau lelongan statik. Mekanisme ini biasanya sasaran tunggal dan untuk satu lelongan.
Sama ada platform pengiklanan atau media, adalah perlu untuk mengimbangi pengalaman pengguna dan hasil pengiklanan Masalah biasa industri ialah pengoptimuman berbilang objektif platform, perniagaan yang berbeza mungkin Terdapat strategi platform dan kehendak di dalamnya, dan ini juga pengoptimuman pelbagai objektif.
Sejak awal, teori lelongan klasik telah digunakan, seperti GSP atau UGSP untuk pengedaran trafik dan penentuan harga Industri secara beransur-ansur berkembang kepada pembelajaran mendalam untuk menyelesaikan masalah ini. Algoritma klasik ini menggunakan formula untuk mengira beberapa parameter yang dioptimumkan oleh platform untuk matlamat tertentu Dengan alat pembelajaran mendalam, reka bentuk mekanisme lelongan itu sendiri juga merupakan masalah membuat keputusan, tetapi ia adalah algoritma untuk menyelesaikan masalah algoritma membuat keputusan pengeluaran juga merupakan masalah membuat keputusan.
Tiga tahun lalu, kami telah mereka bentuk mekanisme lelongan Deep GSP berdasarkan pembelajaran mendalam, yang telah dipertingkatkan berdasarkan premis untuk memenuhi sifat baik mekanisme tersebut; apa yang dipanggil sifat baik mekanisme merujuk kepada insentif Serasi, pengiklan tidak perlu membuat wang melalui selekoh atau menggunakan kaedah hitam putih Mereka benar-benar boleh menyatakan keinginan mereka dan mendapatkan trafik yang memenuhi bida. Deep GSP mengekalkan sifat keserasian insentif dan menggantikan formula statik asal dengan rangkaian dalam yang boleh dipelajari Ini adalah peringkat pertama kerja.
Pada peringkat kedua, kami mengira banyak parameter dalam rangkaian mekanisme lelongan melalui pengoptimuman latihan. Tetapi sebenarnya, dalam keseluruhan proses, sebagai tambahan kepada pengiraan parameter, pengisihan dan proses pengedaran pengiklanan, ia adalah sebahagian daripada keseluruhan sistem. Sesetengah modul sebenarnya tidak boleh dibezakan, seperti modul pengisihan, jadi sukar bagi rangkaian pembelajaran mendalam untuk mensimulasikannya. Untuk mereka bentuk mekanisme lelongan hujung ke hujung, kami memodelkan bahagian proses lelongan yang boleh dibezakan rangkaian saraf, supaya kecerunan boleh diterbalikkan menjadikan latihan model lebih mudah.
Strategi pembidaan pintar.
Seterusnya, mari kita bincangkan tentang strategi pembidaan pintar, yang merupakan alat paling penting yang digunakan oleh pengiklan untuk melaraskan kesan atau permainan. Pengedaran berpusat tidak dapat menyatakan permintaan, tetapi ada cara untuk menyatakannya dalam senario pengiklanan. Produk pembidaan dibahagikan kepada tiga peringkat pembangunan:
Penyelesaian klasik awal juga merupakan kaedah pembidaan tertua Diharapkan belanjawan akan dibelanjakan dengan lebih lancar dan kesannya lebih banyak terjamin Pada mulanya, industri menerima pakai Sama seperti algoritma kawalan PID, ini adalah algoritma yang sangat mudah dan kesannya agak terhad.
Pada 2014 dan 2015, selepas AlphaGo mengalahkan manusia, kami melihat kuasa pembelajaran pengukuhan. Pembidaan pintar adalah masalah membuat keputusan urutan yang sangat tipikal Semasa kitaran belanjawan, sama ada perbelanjaan sebelumnya adalah baik atau tidak akan mempengaruhi keputusan pembidaan seterusnya, dan ini adalah kekuatan pembelajaran pengukuhan, kami menggunakan pembidaan berdasarkan pembelajaran peneguhan , melalui pemodelan MDP, secara langsung menggunakan pembelajaran peneguhan untuk melakukan ini.
Peringkat ketiga berkembang menjadi platform SORL, yang dicirikan oleh ketidakkonsistenan antara persekitaran simulasi luar talian dan persekitaran dalam talian dalam pembelajaran pengukuhan. Kami menjalankan pembelajaran interaktif secara langsung dalam persekitaran dalam talian, yang merupakan contoh gabungan reka bentuk kejuruteraan dan reka bentuk algoritma. Selepas SORL dilancarkan, ia sebahagian besarnya menyelesaikan masalah pergantungan kuat pembelajaran pengukuhan pada platform simulasi.
Ciri teknikal lain termasuk infrastruktur kejuruteraan, termasuk rangka kerja latihan model pembidaan pintar, sistem kawalan aliran dan kelompok bersepadu serta enjin dalam talian grafik penghantaran berbilang saluran. Sistem kejuruteraan dan algoritma adalah sama pentingnya Lebih dekat dan lebih masa nyata kepada pusat perdagangan, lebih baik maklum balas yang boleh diperolehi Untuk pembidaan pintar, lebih maju infrastruktur kejuruteraan, lebih baik ia dapat membantu pengiklan mencapai lebih baik keputusan.
Strategi pengkomersialan pintar.
Akhir sekali, mari kita bincangkan tentang strategi pengkomersilan pintar yang berkaitan dengan media. Dari segi pengoptimuman strategi pengkomersilan, percubaan awal adalah untuk menyepadukan hasil pengiklanan secara wajar dan hasil semula jadi, kemudian mencampurkannya dan memilihnya mengikut situasi yang berbeza. Mekanisme pengkomersilan yang tidak munasabah sangat berbahaya kepada pengalaman pengguna, dan semua orang mula menyedari masalah ini. Dalam satu atau dua tahun lalu, strategi paparan dinamik secara beransur-ansur menjadi popular Dengan perkembangan teknologi seperti pembelajaran mendalam, kami boleh mengimbangi pengalaman pengguna dan hasil komersial dengan mengoptimumkan algoritma membuat keputusan dan mengimbangi pengalaman pengguna dengan trafik global.
Secara umumnya, dalam tiga aspek utama ini, Alimama telah membentuk gambarajah sistem pintar membuat keputusan, yang dibahagikan kepada tiga peringkat, lelongan pintar Mekanisme adalah jambatan di tengah Masalah yang diselesaikan oleh strategi pengkomersialan pintar ialah jenis lelongan sumber yang paling berkesan dan boleh mengimbangi pengalaman pengguna dan hasil komersial yang terbaik. Strategi pembidaan pintar ialah proses membuat keputusan untuk diperhalusi pembidaan untuk trafik. Melalui pengoptimuman Parameter pembidaan, pengoptimuman parameter pembelajaran pengukuhan berdasarkan persekitaran sebenar atau pengoptimuman menggunakan paradigma pemodelan seperti Target CPX dan Pulangan Maks.
Berdepan dengan lelongan berbilang pusingan dan lelongan frekuensi tinggi semasa, banyak teori asas memerlukan penemuan lebih lanjut. Apabila bercakap tentang penemuan teori dalam mekanisme asas, Teacher Deng adalah pakar dalam bidang ini, dan kami berharap dapat bekerjasama dengannya untuk menjalankan penyelidikan termaju dalam bidang ini. Dari perspektif cabaran dalam masalah kejuruteraan praktikal, persekitaran sebenar memerlukan keputusan dikembalikan dalam 200 milisaat, jadi perlu ada keseimbangan antara kecekapan dan kesan yang saya alami selepas bekerja dalam industri untuk masa yang lama.
Pengoptimuman ekologi pengiklanan adalah agak bebas Matlamat utama platform adalah untuk ekologi berkembang maju dan berkembang secara aman Jika ini dilakukan dengan baik, bolehkah ekologi memenuhi jangkaan? Saya tidak fikir mungkin terdapat persamaan langsung antara keduanya. Mengenai pengoptimuman ekologi, masih banyak masalah teori dan praktikal yang perlu diselesaikan, yang saya harap rakan-rakan dalam industri dapat membincangkan dan menyelesaikan bersama di masa hadapan.
Dalam tiga tahun yang lalu, Alimama telah menerbitkan hampir 20 kertas kerja dalam persidangan antarabangsa terkemuka (NeurIPS, ICML, KDD, WWW, dll.) mengenai perisikan membuat keputusan, dan telah bekerjasama dengan Universiti Peking, Universiti Shanghai Jiao Tong, Akademi Sains China, Universiti Zhejiang dan banyak universiti dan institusi penyelidikan lain telah bekerjasama, dan keputusan yang berkaitan telah mendapat perhatian dan susulan meluas daripada industri dan akademia, kami telah mencapai pembangunan teknologi daripada mengikuti kepada menerajui industri secara beransur-ansur.
Berbanding dengan pembelajaran mendalam, risikan keputusan tidak begitu mendapat perhatian dalam industri dan akademik, jadi saya ingin mengambil peluang ini untuk memberitahu semua orang lebih banyak tentang bidang ini, iaitu sangat menarik dan menarik. Perkara di atas adalah pemikiran dan usaha Alimama mengenai kecerdasan membuat keputusan. Saya berharap untuk berkongsi dengan rakan-rakan dalam industri dan akademia. aplikasi praktikal dalam industri.
Atas ialah kandungan terperinci Bagaimanakah bidang perniagaan perisikan digital bertindak balas terhadap cabaran teknologi perisikan membuat keputusan? Jawapan daripada tiga orang pakar. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!