Rumah web3.0 Inferens AI Masa Nyata pada Skala dengan Soket Web dan Objek Tahan Lama

Inferens AI Masa Nyata pada Skala dengan Soket Web dan Objek Tahan Lama

Nov 20, 2024 am 09:08 AM
authentication Durable Objects WebSockets AI Gateway

Pada Oktober 2024, kami telah membincangkan tentang menyimpan berbilion-bilion log daripada aplikasi AI anda menggunakan AI Gateway, dan cara kami menggunakan Platform Pembangun Cloudflare untuk melakukan ini.

Inferens AI Masa Nyata pada Skala dengan Soket Web dan Objek Tahan Lama

Pada Oktober 2024, kami membincangkan cara menyimpan berbilion-bilion log daripada aplikasi AI anda menggunakan AI Gateway, dan cara kami menggunakan Platform Pembangun Cloudflare untuk melakukan ini.

Dengan AI Gateway sudah memproses lebih 3 bilion log dan mengalami pertumbuhan pesat, bilangan sambungan ke platform terus meningkat dengan stabil. Untuk membantu pembangun mengurus skala ini dengan lebih berkesan, kami ingin menawarkan alternatif untuk melaksanakan HTTP/2 keep-alive untuk mengekalkan sambungan HTTP(S) yang berterusan, dengan itu mengelakkan overhed jabat tangan berulang dan rundingan TLS dengan setiap sambungan HTTP baharu ke AI Gateway . Kami faham bahawa melaksanakan HTTP/2 boleh menimbulkan cabaran, terutamanya apabila banyak perpustakaan dan alatan mungkin tidak menyokongnya secara lalai dan kebanyakan bahasa pengaturcaraan moden mempunyai perpustakaan WebSocket yang mantap tersedia.

Dengan mengambil kira perkara ini, kami menggunakan Platform Pembangun Cloudflare dan Objek Tahan Lama (ya, sekali lagi!) untuk membina API WebSockets yang mewujudkan sambungan tunggal yang berterusan, membolehkan komunikasi berterusan.

Melalui API ini, semua penyedia AI yang disokong oleh AI Gateway boleh diakses melalui WebSocket, membolehkan anda mengekalkan satu sambungan TCP antara aplikasi klien atau pelayan anda dan AI Gateway. Bahagian yang terbaik? Walaupun pembekal pilihan anda tidak menyokong WebSockets, kami mengendalikannya untuk anda, menguruskan permintaan kepada pembekal AI pilihan anda.

Dengan menyambung melalui WebSocket ke AI Gateway, kami membuat permintaan kepada perkhidmatan inferens untuk anda menggunakan protokol yang disokong penyedia (HTTPS, WebSocket, dll.), dan anda boleh memastikan sambungan terbuka untuk melaksanakan seberapa banyak permintaan inferens seperti yang anda mahu.

Untuk menjadikan sambungan anda ke AI Gateway lebih selamat, kami juga memperkenalkan pengesahan untuk AI Gateway. API WebSockets baharu akan memerlukan pengesahan. Apa yang anda perlu lakukan ialah mencipta token Cloudflare API dengan kebenaran “AI Gateway: Run” dan hantarkannya dalam pengepala cf-aig-authorization.

Dalam rajah alir di atas:

1. Apabila Gerbang Disahkan didayakan dan token yang sah disertakan, permintaan akan berjaya diluluskan.

2. Jika Gerbang Disahkan didayakan, tetapi permintaan tidak mengandungi pengepala kebenaran cf-aig yang diperlukan dengan token yang sah, permintaan itu akan gagal. Ini memastikan hanya permintaan yang disahkan melalui get laluan.

3. Apabila Gerbang Disahkan dilumpuhkan, pengepala cf-aig-authorization dipintas sepenuhnya dan sebarang token — sama ada sah atau tidak sah — diabaikan.

Cara kami membinanya

Kami baru-baru ini menggunakan Objek Tahan Lama (DO) untuk menskalakan penyelesaian pengelogan kami untuk AI Gateway, jadi menggunakan WebSockets dalam DO yang sama adalah kesesuaian semula jadi.

Apabila sambungan WebSocket baharu diterima oleh Cloudflare Workers kami, kami melaksanakan pengesahan dalam dua cara untuk menyokong pelbagai keupayaan pelanggan WebSocket. Kaedah utama melibatkan pengesahan token Cloudflare API melalui pengepala cf-aig-authorization, memastikan token itu sah untuk akaun penghubung dan get laluan.

Walau bagaimanapun, disebabkan oleh pengehadan dalam pelaksanaan WebSocket penyemak imbas, kami juga menyokong pengesahan melalui pengepala "sec-websocket-protocol". Pelanggan WebSocket Penyemak Imbas tidak membenarkan pengepala tersuai dalam API standard mereka, merumitkan penambahan token pengesahan dalam permintaan. Walaupun kami tidak mengesyorkan anda menyimpan kunci API dalam penyemak imbas, kami memutuskan untuk menambah kaedah ini untuk menambahkan lebih banyak kefleksibelan kepada semua pelanggan WebSocket.

Selepas langkah pengesahan awal ini, kami meningkatkan sambungan kepada Objek Tahan Lama, bermakna ia kini akan mengendalikan semua mesej untuk sambungan. Sebelum sambungan baharu diterima sepenuhnya, kami menjana UUID rawak, jadi sambungan ini boleh dikenal pasti antara semua mesej yang diterima oleh Objek Tahan Lama. Semasa sambungan terbuka, sebarang tetapan Gerbang AI yang diluluskan melalui pengepala — seperti cf-aig-skip-cache (yang memintas cache apabila ditetapkan kepada benar) — disimpan dan digunakan pada semua permintaan dalam sesi. Walau bagaimanapun, pengepala ini masih boleh ditindih atas dasar setiap permintaan, sama seperti dengan Titik Akhir Universal hari ini.

Cara ia berfungsi

Setelah sambungan diwujudkan, Objek Tahan Lama mula mendengar mesej masuk. Mulai saat ini, pengguna boleh menghantar mesej dalam format universal AI Gateway melalui WebSocket, memudahkan peralihan aplikasi anda daripada persediaan HTTP sedia ada kepada komunikasi berasaskan WebSockets.

Apabila mesej baharu sampai ke Objek Tahan Lama, ia diproses menggunakan kod yang sama yang menggerakkan Titik Akhir Universal HTTP, membolehkan penggunaan semula kod lancar merentas Pekerja dan Objek Tahan Lama — salah satu faedah utama membina Cloudflare.

Untuk permintaan bukan penstriman, respons dibungkus dalam sampul JSON, membolehkan kami memasukkan maklumat tambahan di luar inferens AI itu sendiri, seperti ID log AI Gateway untuk permintaan itu.

Berikut ialah contoh jawapan untuk permintaan di atas:

Untuk permintaan penstriman, AI Gateway menghantar mesej awal dengan metadata permintaan memberitahu pembangun strim itu bermula.

Selepas mesej awal ini, semua bahagian penstriman disampaikan dalam masa nyata kepada sambungan WebSocket apabila ia tiba daripada pembekal inferens. Ambil perhatian bahawa hanya medan eventId disertakan dalam metadata untuk potongan penstriman ini (maklumat lanjut tentang medan baharu ini di bawah).

Pendekatan ini mempunyai dua tujuan:

Atas ialah kandungan terperinci Inferens AI Masa Nyata pada Skala dengan Soket Web dan Objek Tahan Lama. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

<🎜>: Bubble Gum Simulator Infinity - Cara Mendapatkan dan Menggunakan Kekunci Diraja
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Nordhold: Sistem Fusion, dijelaskan
4 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌
Mandragora: Whispers of the Witch Tree - Cara Membuka Kunci Cangkuk Bergelut
3 minggu yang lalu By 尊渡假赌尊渡假赌尊渡假赌

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Tutorial Java
1675
14
Tutorial PHP
1278
29
Tutorial C#
1257
24
Metaplanet memperluaskan pegangan Perbendaharaan Bitcoin dengan 319 BTC yang lain Metaplanet memperluaskan pegangan Perbendaharaan Bitcoin dengan 319 BTC yang lain Apr 15, 2025 am 11:20 AM

Dalam pengumuman yang dibuat awal hari ini, firma Jepun Metaplanet mendedahkan ia telah memperoleh 319 Bitcoin (BTC) lagi, menolak jumlah pegangan korporat melebihi 4,500 BTC.

Bitwise mengumumkan penyenaraian empat Crypto ETPS di Bursa Saham London (LSE) Bitwise mengumumkan penyenaraian empat Crypto ETPS di Bursa Saham London (LSE) Apr 18, 2025 am 11:24 AM

Bitwise, pengurus aset digital terkemuka, telah mengumumkan penyenaraian empat produk perdagangan Crypto Exchange (ETP) di London Stock Exchange (LSE).

Bank -bank pusat di seluruh dunia sedang meningkatkan pembelian emas mereka Bank -bank pusat di seluruh dunia sedang meningkatkan pembelian emas mereka Apr 15, 2025 am 11:00 AM

Menurut laporan oleh surat Kobeissi di X, menyebut data dari IMS IFS dan Majlis Emas Global, negara -negara mengumpulkan 24 tan emas pada bulan Februari

Makmal Pergerakan dan Yayasan Rangkaian Pergerakan telah melancarkan siasatan bebas ke dalam penyelewengan pembuatan pasaran baru-baru ini yang berkaitan dengan token langkah. Makmal Pergerakan dan Yayasan Rangkaian Pergerakan telah melancarkan siasatan bebas ke dalam penyelewengan pembuatan pasaran baru-baru ini yang berkaitan dengan token langkah. Apr 16, 2025 am 11:16 AM

NT Labs dan Yayasan Rangkaian Pergerakan melancarkan siasatan bebas ke dalam pemindahan pasaran yang membuat token

Bitcoin (BTC) melayang ke atas kerana pasaran yang lebih luas menyesuaikan diri dengan berita berkaitan perdagangan Bitcoin (BTC) melayang ke atas kerana pasaran yang lebih luas menyesuaikan diri dengan berita berkaitan perdagangan Apr 15, 2025 am 11:14 AM

Cryptocurrency terbesar naik 1.6% dalam 24 jam terakhir dan kini berdagang hanya malu $ 85,000. Sementara itu, Ether (ETH) naik 2.7% meningkat 2.7%

Gelombang modal mengalir keluar dari Ethereum [ETH] dan ke Tron [TRX] Gelombang modal mengalir keluar dari Ethereum [ETH] dan ke Tron [TRX] Apr 16, 2025 am 11:14 AM

Dengan $ 1.52 bilion di stablecoins yang berhijrah ke Tron, pelabur nampaknya memihak kepada rantai kos rendah dan mempelbagaikan di luar aset yang disokong USD tradisional.

Harga token rangkaian PI telah meningkat lebih daripada 14% sejak seminggu yang lalu. Harga token rangkaian PI telah meningkat lebih daripada 14% sejak seminggu yang lalu. Apr 16, 2025 am 11:22 AM

Pada masa akhbar, PI didagangkan pada $ 0.6711 selepas integrasinya dengan ChainLink pada 12 April. Pengumuman itu menyebabkan lonjakan harga pi