Sistem analisis data selamat berbilang pihak gred industri pertama SCQL sumber terbuka oleh Linyu telah mengisi jurang dalam industri dan akan melanjutkan lagi pautan kerjasama keselamatan data dan mengembangkan senario peredaran nilai data.
Kebangkitan model besar sekali lagi mengiktiraf secara mendalam kepentingan data sebagai faktor pengeluaran baharu Sebagai laluan penting untuk mengimbangi penggunaan data dan keselamatan data, pengkomputeran privasi telah menyerlahkan lagi nilai akademik dan nilai aplikasinya. Dalam beberapa tahun kebelakangan ini, didorong oleh dasar dan permintaan pasaran, teknologi dan industri pengkomputeran swasta telah berkembang dengan mantap dan telah digunakan dalam banyak bidang seperti kewangan, komunikasi, Internet, hal ehwal kerajaan dan penjagaan perubatan. Tetapi secara keseluruhan, disebabkan isu seperti ambang teknikal dan kos pembinaan, terdapat aplikasi pengeluaran berskala besar, tetapi jumlahnya sangat kecil.
Pada 29 Mac, pada Hari Terbuka Komuniti Sumber Terbuka Bahasa Tersembunyi yang pertama, rangka kerja sumber terbuka Hidden Language SecretFlow mengeluarkan versi baharu, melancarkan ciri penting yang dinanti-nantikan oleh industri - selamat berbilang pihak sistem analisis data SCQL (Secure Collaborative Query Language ). Ini adalah aplikasi pertama dalam industri yang menggunakan SQL pada teknologi pengkomputeran selamat berbilang pihak (MPC), merealisasikan fungsi analisis data selamat berbilang pihak gred industri Ia kini sumber terbuka dalam komuniti Linguo GitHub dan terbuka kepada pembangun sekitar dunia secara percuma.
Wang Lei, ketua rangka kerja Hidden Language SecretFlow, mengeluarkan sistem SCQL Hidden Language pada Hari Terbuka Komuniti Sumber Terbuka Bahasa Tersembunyi
Ini adalah juga sebab pasukan Hidden Language telah menghabiskan masa tiga tahun dan melalui pelbagai pusingan teknologi Ia disahkan bahawa fungsi produk penting adalah sumber terbuka dan dikeluarkan selepas memenuhi senario aplikasi gred industri dari segi prestasi dan keselamatan memperluaskan hubungan kerjasama keselamatan data dan mengembangkan senario peredaran nilai data, terutamanya untuk memenuhi keperluan syarikat long-tail dan majoriti keperluan analisis data kecil dan sederhana.
Wang Lei, ketua Rangka Kerja Linguistik dan pengurus besar Jabatan Teknologi Pengkomputeran Pintar Privasi Ant Group, berkata dalam temu bual eksklusif dengan Machine Heart bahawa apabila pengkomputeran privasi jatuh ke dalam industri dan menyelesaikan masalah praktikal berskala besar pengguna, berbanding dengan analisis data AI dan senario aplikasi BI akan menjadi lebih luas ketika ini SQL adalah alat analisis BI yang paling biasa Linyu mengeluarkan sistem SCQL kali ini dengan harapan pengguna boleh memahami dan menggunakan privasi pada kos rendah berdasarkan aliran kerja biasa. Teknologi pengkomputeran.
Pada masa ini, pengkomputeran privasi memasuki peringkat baharu Pematuhan keselamatan teknologi titik tunggal telah disahkan oleh juruterbang Terutama sejak pengumuman Twenty Data Articles, gabungan data besar dan pengkomputeran privasi. direalisasikan untuk mencapai privasi. Pengiraan ketersediaan dan kemudahan penggunaan BI dan menurunkan ambang teknikal telah menjadi cabaran teras pada peringkat semasa Hanya dengan terus mengembangkan keluasan dan kedalaman aplikasi teknologi kita boleh benar-benar menerima era komprehensif masa depan. ketumpatan elemen data berskala besar.
Wang Lei berkata bahawa pasukan Lingu telah membuat penemuan teknikal dalam penghuraian bahasa SQL, pengoptimuman prestasi pengkomputeran MPC dan keselamatan penyongsangan hasil, dan telah menyediakan beberapa penyelesaian baharu yang sangat baik untuk beberapa masalah dan mencapai keputusan yang baik. Beliau juga menekankan bahawa terdapat lebih banyak masalah yang mencabar dan terbuka dan mengharapkan lebih ramai orang mengambil bahagian dalam membina komuniti sumber terbuka pengkomputeran persendirian dan meneroka lebih banyak senario aplikasi bersama-sama.
Menurut "Kematangan Perisikan Perusahaan China" yang dikeluarkan oleh Akademi China Teknologi Maklumat dan Komunikasi pada Januari tahun ini Laporan (2022)", pada masa ini 84% perusahaan masih dalam peringkat asas pembinaan digital, dan masih berada dalam jarak tertentu daripada merealisasikan operasi pintar dan pembangunan inovatif. Untuk bahagian perusahaan ini, terdapat banyak keperluan perniagaan BI.
Kebanyakan teknologi BI yang tersedia pada masa ini mampu melindungi data apabila ia disimpan atau dihantar, tetapi tidak mempunyai fungsi untuk melindungi keselamatan proses pengiraan data Bagi organisasi yang mempunyai permintaan berkaitan privasi dan keselamatan, ini hanyalah satu peluang yang meluaskan Ia memecahkan sempadan teknologi BI tradisional dan boleh digunakan untuk lebih banyak senario. Apabila pemasaran elemen data semakin maju, akan wujud jurang industri yang serius dalam analisis BI pengkomputeran privasi.
Dalam konteks ini, Linyu melancarkan projek SCQL, yang menggabungkan SQL yang paling biasa digunakan dalam analisis BI dengan pengiraan selamat berbilang pihak (MPC) dalam pengkomputeran privasi, sebagai satu cara untuk membawa pengkomputeran privasi kepada industri dan di seluruh industri. Langkah pertama ke arah aplikasi berskala besar dalam ekosistem yang besar dan kompleks.
Memfokuskan pada senario analisis bersama data berbilang pihak adalah kerana berbanding dengan laluan teknikal Persekitaran Pelaksanaan Dipercayai (TEE), ia memerlukan akar kepercayaan perkakasan, dan kematangan penyetempatan semasa masih memerlukan masa untuk disahkan dan digilap. Keselamatan pelbagai pihak Laluan teknologi pengkomputeran (MPC) mempunyai kelebihan unik: kawalan data yang lebih kukuh, tiada pergantungan pada perkakasan khas, dsb. Di samping itu, dalam beberapa senario di mana data satu pihak adalah agak nipis, kualiti analisis data juga boleh dipertingkatkan dengan mengembangkan sampel atau dimensi data, iaitu, menggabungkan data daripada berbilang pihak untuk membuat keputusan bersama, dan akhirnya dalam kesan perniagaan. analisis, peningkatan strategi perniagaan dan inovasi model perniagaan Dapatkan hasil yang lebih baik. Contohnya:
Walau bagaimanapun, terdapat cabaran teknikal yang hebat dalam merealisasikan gabungan SQL dan MPC. Pertama sekali, SQL ialah seni bina yang kompleks Apabila ia digunakan dalam senario pengkomputeran peribadi, cara menyelesaikan kerumitan reka bentuk seni bina melibatkan penghuraian bahasa SQL, dan ambang teknikal untuk penghuraian ini sangat tinggi. Kedua, dalam senario penggunaan SQL, pengguna mempunyai keperluan yang sangat tinggi pada masa tindak balas selepas penyerahan pertanyaan, dan secara amnya mengharapkan untuk melihat hasilnya dengan serta-merta, bagaimanapun, prestasi pengkomputeran MPC adalah sangat rendah. Ketiga, bagaimana untuk mengelakkan bahasa pertanyaan SQL yang fleksibel daripada menanyakan maklumat sensitif yang pengguna tidak mahu lihat.
Berdasarkan peranti SPU abstrak yang mendasari teras teknologi MPC (Unit Pemprosesan SecretFlow, singkatannya SPU, yang merupakan unit pengkomputeran rahsia platform Lingu dan menyediakan perkhidmatan pengkomputeran selamat untuk rangka kerja Lingu), Linyu pasukan secara inovatif merealisasikan analisis data keselamatan berbilang pihak Sistem SCQL. SCQL menyokong bahasa pertanyaan seperti SQL Bahasa ini mewarisi populariti, kemudahan pembelajaran dan kematangan tinggi SQL sebagai bahasa analisis data yang biasa digunakan Ia boleh melengkapkan statistik analisis bersama tanpa pengguna hampir tidak memahami semantik berbilang pihak. pengkomputeran selamat.
Seni bina SCQL ditunjukkan dalam rajah di bawah Ia terbahagi kepada dua bahagian atas SCDB boleh dianggap sebagai pangkalan data SCQL Ia bertanggungjawab untuk menterjemahkan pertanyaan ke dalam graf pelaksanaan keadaan padat dan mengeluarkan ia ke pangkalan data yang digunakan pada peserta data pelaksanaan Enjin SCQL ialah enjin pelaksanaan SCQL Ia akan bekerjasama dengan Enjin SCQL peserta lain untuk menyelesaikan pelaksanaan graf keadaan padat dan melaporkan hasilnya kepada SCDB.
Secara khusus, pengguna luaran boleh secara langsung memulakan permintaan SQL tradisional ini terlebih dahulu akan melalui Parser dan ditukar menjadi pokok sintaks abstrak, dan kemudian melalui Planner, ia akan. menjadi rancangan Logik. Cabaran terbesar ialah dari pelan Logik kepada Graf Perlaksanaan, di mana Penterjemah perlu melakukan pemilihan protokol optimum di bawah pelbagai kekangan Ini adalah kunci untuk membuat pengiraan peribadi SQL, kerana terdapat kekangan keselamatan dalam keseluruhan pengiraan, yang mana. memerlukan Pertimbangkan secara menyeluruh jenis data, sumber data dan status data, dan status data akan terus berhijrah dan berubah dengan proses pengkomputeran.
Di sini, pasukan Lingu melaksanakan mekanisme CCL (Senarai Kawalan Lajur) secara inovatif sebagai penyelesaian bijak kepada fleksibiliti dan fungsi SQL dalam senario pengkomputeran selamat berbilang pihak. CCL menyediakan alat bantu yang membolehkan pemilik data menggunakan CCL untuk menerangkan kekangan penggunaan setiap lajur data sebelum semakan awal Hanya jika kekangan dipenuhi dengan ketat, enjin analisis data akan melaksanakannya.
Pada masa ini, 6 jenis kekangan disediakan, dan rangka kerja lingo akan terus diperbaiki dan diperhalusi dalam hal ini pada masa hadapan.
Ringkasnya, penyelesaian bahasa SCQL telah membuat percubaan yang sangat baik untuk menangani cabaran teknikal seperti ketepatan, ketepatan masa dan keselamatan, dan telah mencapai ciri fungsi berikut:
Meluaskan senario aplikasi peredaran data
Memerlukan pengkomputeran privasi yang mudah digunakan dan mudah digunakan
Wang Lei percaya bahawa teknologi dan pasaran pengkomputeran privasi keseluruhan semasa adalah masih di peringkat awal, dan industri masih di peringkat awal. Terdapat pemahaman yang tidak mencukupi tentang teknologi pengkomputeran privasi. Linyu berharap dapat menetapkan penanda aras universal yang mudah digunakan dan membantu mengaktifkan aplikasi dalam keseluruhan industri pengkomputeran swasta. Sudah tentu, "Keselamatan ialah teras pengkomputeran privasi. Hanya pada premis memastikan keselamatan kita boleh bercakap tentang ketepatan, prestasi dan kemudahan penggunaan. Jika tidak, ia boleh dicapai dengan teknologi lain." konsep umum berjalan melalui penyelidikan dan pembangunan Argot dari awal hingga akhir.
Wang Lei memperkenalkan bahawa Kumpulan Ant mula meneroka pengkomputeran privasi pada 2016 dan mempraktikkan serta memikirkan melalui penyelidikan perniagaan dan industri dalaman. Semasa proses ini, juruteknik mendapati bahawa terdapat banyak laluan teknologi pengkomputeran privasi dan seni bina yang berbeza Oleh itu, seni bina pengkomputeran privasi yang ideal harus terlebih dahulu lengkap, menyokong rangka kerja teknologi arus perdana, dan mengambil kira pembangunan teknologi baharu. Kedua, untuk memudahkan lelaran berterusan, seni bina mesti dipisahkan dari lapisan bawah ke lapisan atas. Selain itu, seni bina juga harus mempunyai reka bentuk berlapis yang baik untuk memisahkan keselamatan dan algoritma, memudahkan aplikasi, dan meningkatkan keluasan aplikasi dan ambang penyertaan teknologi pengkomputeran privasi. Penyepaduan perniagaan dan keupayaan pengeluaran berskala besar juga penting, memerlukan reka bentuk antara muka yang baik dan keupayaan pengeluaran berskala besar, seperti skala kelabu, rollback, pengembangan anjal dan pengurusan berbilang versi.
Rangka kerja lingo menyokong laluan teknologi pengkomputeran privasi arus perdana untuk menyesuaikan diri dengan lebih baik kepada keperluan senario yang berbeza Ini juga memudahkan untuk menyepadukan dan memindahkan berbilang laluan teknologi dan belajar daripada kekuatan satu sama lain. Pada masa yang sama, pada tahap perancangan yang lebih tinggi, Linyu sedang mereka bentuk penyelesaian teknikal untuk menyokong "pemisahan tiga hak" pemilikan elemen data, hak penggunaan dan hak operasi untuk merealisasikan pemilikan data secara teknikal yang dicadangkan dalam Twenty Data Articles. Ideologi panduan "pemisahan tiga hak": hak, hak penggunaan dan hak pengurusan.
Pengkomputeran privasi bukan hanya helah yang mewah, tetapi benar-benar memikirkan perkara yang dikehendaki oleh industri yang telah difikirkan oleh pasukan Wang Lei tentang cara menyediakan penyelesaian yang lebih selamat, lebih cekap, lebih kukuh dan lebih fleksibel. Pada masa ini, aplikasi berskala besar dalam industri dibahagikan kepada dua kategori: BI dan AI boleh dibahagikan kepada banyak subkategori, seperti analisis data SQL tradisional dan analisis data berasaskan Python, serta pemprosesan data besar, kumpulan aliran. pemprosesan, dsb. Industri pembelajaran mesin yang memelihara privasi untuk senario AI kini agak matang, dan terdapat banyak penyelesaian teknikal dan produk pilihan di pasaran.
Saya memikirkan institusi data berskala kecil tersebut, yang cenderung bermula dengan volum data yang lebih kecil iaitu berjuta-juta atau berpuluh juta, kerana pemprosesan sedemikian boleh merangkumi banyak senario aplikasi, dan memerlukan lebih banyak pelaburan dan Ia juga lebih boleh dilaksanakan dari segi output.
"Memandangkan tahap pendigitalan organisasi kecil dan sederhana berada di peringkat awal dan jumlah data dalam peringkat sampel kecil, kaedah pembelajaran mesin Al tidak diperlukan dan tidak kos efektif, dan analisis BI menggunakan bahasa SQL sebagai kaedah utama adalah Penyelesaian yang paling boleh dilaksanakan 》
Untuk senario data berskala besar, analisis data BI juga merupakan kaedah analisis yang amat diperlukan dan penting. "Daripada data besar kepada data kecil, SCQL boleh memenuhi keperluan analisis keselamatan data yang padat," tegas Wang Lei.
Sudah tentu, untuk aplikasi AI, lingo akan terus berulang Contohnya, jika algoritma XGB digunakan secara meluas dalam industri, versi yang lebih pantas akan dikeluarkan.
Wang Lei berkata bahawa aliran masa hadapan pengkomputeran privasi mesti termasuk penyepaduan teknologi, yang bukan sahaja merangkumi penyepaduan antara bidang teknikal yang berbeza, tetapi juga penyepaduan antara alatan teknikal. Dari perspektif keseluruhan tindanan teknologi pengkomputeran privasi, penyelesaian akhir mestilah keratan rentas berbilang teknologi untuk menyelesaikan pelbagai masalah Berdasarkan kebolehgunaan senario penggunaan dan keperluan keselamatan, teknologi pengkomputeran privasi untuk senario berbeza dipilih.
Lingyu berharap dapat menggunakan teknologi untuk membina kepercayaan industri dalam pengkomputeran privasi sebagai infrastruktur peredaran elemen data, dan bersama-sama menyokong pelbagai aplikasi melalui model hab dan model saluran paip, dengan tujuan untuk menyokong pengembangan berskala besar keseluruhan industri pada masa hadapan.
Argumen sumber terbuka mempunyai dua tujuan: satu adalah untuk berharap lebih ramai orang boleh menggunakan pengkomputeran persendirian; yang lain adalah untuk berharap lebih ramai orang dapat membina komuniti bersama-sama. Pada masa ini, bilangan orang yang mengambil bahagian dalam pembinaan bersama adalah agak kecil Linyu merancang untuk meningkatkan hala tuju pembinaan bersama dan menambah baik proses pembinaan bersama tahun ini Kami berharap untuk meneroka lebih banyak kemungkinan untuk pengkomputeran privasi dengan semua orang.
Tapak web rasmi bahasa rahsia:
https://www.secretflow.org.cn
Komuniti bahasa rahsia:
https://github.com/secretflow
https://gitee.com/secretflow
Atas ialah kandungan terperinci Linyu sumber terbuka sistem analisis data selamat berbilang pihak gred industri pertama SCQL: pengkomputeran persendirian 'mudah digunakan' seperti menulis SQL. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!