


Cara Membina Ejen AI yang boleh Menggunakan mana-mana Laman Web
Menghubungkan Ejen AI ke Web: Perjalanan Pembangun dan Peningkatan Penggunaan Komputer
Satu halangan utama dalam pembangunan ejen AI sejak dua tahun lalu ialah memberikan akses web dengan pasti. Pertimbangkan ejen AI yang direka untuk menghantar e-mel: bagaimana anda menyambungkannya ke Gmail atau Outlook? API, tapak web atau ejen web autonomi? Artikel ini meneroka pelbagai kaedah.
API dan SDK: Pendekatan Terhad
Ramai pembangun menggunakan API dan SDK. Ini menawarkan kependaman rendah dan pengesahan yang mantap, tetapi had wujud:
- Ketidaktersediaan API: Tidak semua perkhidmatan web menyediakan API.
- Cabaran Dokumentasi: Dokumentasi yang lapuk atau ditulis dengan buruk adalah perkara biasa.
- Jurang Ciri: API selalunya tidak mempunyai kefungsian penuh tapak web yang sepadan, menghalang tugas tertentu.
Nasib baik, beberapa perkhidmatan menawarkan perpustakaan panggilan API:
- Komposio: Menyediakan alatan untuk ejen AI dengan pengesahan yang kukuh.
- Alat Langchain: Sumber untuk ejen Langchain/graf.
- Apify: Pustaka API dipacu komuniti yang luas.
Walau bagaimanapun, untuk akses perkhidmatan web universal, kita mesti bergerak melangkaui API.
Interaksi Laman Web: Pendekatan Manusia
Interaksi tapak web ejen AI yang boleh dipercayai membolehkan automasi sebarang tugas manusia berasaskan web. Tetapi bagaimana?
Ramai pembangun pada mulanya menggunakan rangka kerja ujian penyemak imbas seperti Selenium atau Penulis Drama. Pendekatan ini, bagaimanapun, menghadapi cabaran:
- Kerapuhan: Perubahan tapak web (mis., ujian A/B) dengan mudah memecahkan skrip.
- Kebolehkesanan: Pelayar ujian dikenal pasti dan disekat dengan mudah.
- Pengeluaran Pengeluaran: Mengehos penyemak imbas, mengurus pengesahan dan proksi berputar adalah rumit dalam pengeluaran.
Untuk menangani isu ini, kami bereksperimen dengan SDK Penyemak Imbas yang:
- Menggunakan pemilih bahasa semula jadi (cth.,
get_element("find the login button")
) dan bukannya pemilih CSS rapuh. - Mengintegrasikan pengesahan terbina dalam.
- Menawarkan pengehosan jauh prakonfigurasi dengan proksi berputar terbina dalam untuk mengelakkan penyekatan.
Karya ini, kini sumber terbuka (Dendrite SDK), tidak lagi dalam pembangunan aktif tetapi masih tersedia untuk kajian dan penyesuaian. Alternatif serupa termasuk:
- AgentQL: Pustaka Python.
- Stagehand: Pustaka JavaScript/TypeScript.
Penggunaan Komputer: Masa Depan Ejen AI Web?
"Pelajaran Pahit" Rich Sutton menyerlahkan penguasaan penyelesaian AI yang boleh digeneralisasikan yang boleh skala dengan pengiraan yang lebih tinggi. Penggunaan Komputer Anthropic merangkumi prinsip ini, membenarkan LLM mengawal komputer/pelayar secara langsung menggunakan input tetikus dan papan kekunci, menghapuskan keperluan untuk skrip dan panggilan API. Pendekatan mereka menekankan kemahiran komputer umum berbanding alat khusus tugas. Ini selaras dengan sempurna dengan Pelajaran Pahit, mencadangkan bahawa ejen AI yang paling serba boleh akan berinteraksi secara langsung dengan web seperti manusia. Keputusan awal menunjukkan kebolehpercayaan yang tinggi dalam tugasan yang kompleks menggunakan gesaan yang direka dengan baik, selalunya dipertingkatkan oleh penambahbaik segera Anthropic.
Kesimpulan: Merangkul Masa Depan
Walaupun API kekal berharga, masa depan mungkin lebih mengutamakan pendekatan seperti Penggunaan Komputer untuk kebanyakan ejen AI. Jika ejen boleh log masuk dan menggunakan fungsi carian tapak web, mengekstrak kesimpulan daripada hasil teratas, mengapa bergantung pada keseluruhan pangkalan data melalui API? Persoalan untuk pembangun AI ialah sama ada untuk menerima pendekatan yang boleh digeneralisasikan ini atau berisiko menghadapi batasan kaedah yang lebih khusus.
Nota: Ini adalah siaran dev. pertama saya. Maklum balas untuk menambah baik siaran akan datang adalah dialu-alukan. Soalan mengenai ejen AI atau automasi tugas dipacu AI juga digalakkan.
Atas ialah kandungan terperinci Cara Membina Ejen AI yang boleh Menggunakan mana-mana Laman Web. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Alat AI Hot

Undresser.AI Undress
Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover
Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool
Gambar buka pakaian secara percuma

Clothoff.io
Penyingkiran pakaian AI

Video Face Swap
Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Artikel Panas

Alat panas

Notepad++7.3.1
Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina
Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1
Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6
Alat pembangunan web visual

SublimeText3 versi Mac
Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Topik panas

Penyelesaian kepada Isu Kebenaran Semasa Melihat Versi Python di Terminal Linux Apabila anda cuba melihat versi Python di Terminal Linux, masukkan Python ...

Cara mengelakkan dikesan semasa menggunakan fiddlerevery di mana untuk bacaan lelaki-dalam-pertengahan apabila anda menggunakan fiddlerevery di mana ...

Apabila menggunakan Perpustakaan Pandas Python, bagaimana untuk menyalin seluruh lajur antara dua data data dengan struktur yang berbeza adalah masalah biasa. Katakan kita mempunyai dua DAT ...

Bagaimanakah Uvicorn terus mendengar permintaan HTTP? Uvicorn adalah pelayan web ringan berdasarkan ASGI. Salah satu fungsi terasnya ialah mendengar permintaan HTTP dan teruskan ...

Fastapi ...

Menggunakan Python di Terminal Linux ...

Bagaimana Mengajar Asas Pengaturcaraan Pemula Komputer Dalam masa 10 jam? Sekiranya anda hanya mempunyai 10 jam untuk mengajar pemula komputer beberapa pengetahuan pengaturcaraan, apa yang akan anda pilih untuk mengajar ...

Memahami Strategi Anti-Crawling of Investing.com Ramai orang sering cuba merangkak data berita dari Investing.com (https://cn.investing.com/news/latest-news) ...
