Rumah pembangunan bahagian belakang Tutorial Python Cara Menggunakan Apl AI (dengan Large Deps) ke AWS Lambda

Cara Menggunakan Apl AI (dengan Large Deps) ke AWS Lambda

Oct 10, 2024 am 06:12 AM

How to Deploy an AI App (w/ Large Deps) to AWS Lambda

Baru-baru ini saya meluangkan masa dua jam mendapatkan apl LlamaIndex ringkas untuk dijalankan pada AWS Lambda. Walaupun fungsi itu sendiri hanya terdiri daripada beberapa baris kod Python (seperti yang ditunjukkan di bawah), mengurus kebergantungan dan penggunaan boleh menjadi rumit.

import json
from llama_index.llms.openai import OpenAI

llm=OpenAI(model="gpt-4o-mini")

def lambda_handler(event, context):
    response = llm.complete("What public transportation might be available in a city?")
    return {
        'statusCode': 200,
        'body': str(response),
    }

Salin selepas log masuk

Berikut ialah beberapa petua utama yang membantu saya:

Mula-mula, pasang pakej untuk platform yang betul. Adalah penting untuk memasang semua pakej untuk platform sasaran "manylinux2014_x86_64". Jika tidak, pakej tertentu mungkin tidak serasi dengan masa jalan AWS Lambda. Untuk memastikan keserasian, pasang kebergantungan dengan arahan berikut:

pip install -r requirements.txt --platform manylinux2014_x86_64 --target ./deps --only-binary=:all:
Salin selepas log masuk

Kedua, Lambda mempunyai had 250MB untuk jumlah saiz pakej kod, yang boleh menjadi isu dengan cepat jika anda menggunakan LlamaIndex atau kebergantungan besar yang lain. Jika pakej anda melebihi had ini, semak fail terbesar dalam folder dependensi anda:

du -h -d 2 | sort -hr | head -n20
Salin selepas log masuk

Dalam kes saya, saya mendapati bahawa direktori panda/ujian mengambil kira-kira 35MB ruang, yang tidak diperlukan untuk fungsi saya, jadi saya mengalih keluarnya untuk mengembalikan saiz pakej dalam had.

rm -r deps/pandas/tests
Salin selepas log masuk

Kemudian, zip semuanya dan muat naik melalui S3. Selepas memangkas fail yang tidak diperlukan, buat arkib zip yang mengandungi kedua-dua kod dan kebergantungan anda. Memandangkan konsol web Lambda mempunyai had muat naik 50MB, anda perlu memuat naik fail zip yang lebih besar ke baldi S3 dan menggunakan URI S3 untuk menggunakan fungsi tersebut.

zip -r test_lambda.zip data/ lambda_function.py
cd deps/
zip -r ../test_lambda.zip .
Salin selepas log masuk

Akhir sekali, laraskan tetapan Lambda anda sebelum digunakan. Secara lalai, fungsi Lambda hanya diperuntukkan memori 128MB dan tamat masa 3 saat, yang tidak mencukupi untuk banyak aplikasi AI yang melibatkan kebergantungan besar dan memanggil LLM. Saya akan meningkatkan memori kepada 512MB dan memanjangkan tamat masa kepada 30 saat. Selain itu, jangan lupa untuk menetapkan pembolehubah persekitaran penting seperti Kunci API OpenAI anda.

Saya mengambil masa yang agak lama untuk memikirkan cara yang betul untuk memasang pakej dan menggabungkan semuanya bersama-sama untuk Lambda. AWS Lambda mesra pengguna untuk skrip asas, tetapi apabila anda menambah kebergantungan yang lebih besar, keadaan menjadi lebih rumit.

Berikut ialah urutan terakhir langkah:

# Install dependencies
pip install -r requirements.txt --platform manylinux2014_x86_64 --target ./deps --only-binary=:all:

# Create a zip file for code and data
zip -r test_lambda.zip data/ lambda_function.py

# Include dependencies in the zip file, while removing large unused files
cd deps/
rm -r pandas/tests
zip -r ../test_lambda.zip .
Salin selepas log masuk

p.s., saya juga cuba menggunakan fungsi serupa pada DBOS Cloud, dan ia hanya mengambil satu arahan:

dbos-cloud app deploy
Salin selepas log masuk

Dalam DBOS, pengurusan pergantungan dikendalikan secara automatik melalui fail requirements.txt dan pembolehubah persekitaran ditetapkan dalam dbos-config.yaml. Saya mungkin berat sebelah, tetapi saya menikmati kesederhanaan proses penggunaan DBOS Cloud.

Atas ialah kandungan terperinci Cara Menggunakan Apl AI (dengan Large Deps) ke AWS Lambda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn

Alat AI Hot

Undresser.AI Undress

Undresser.AI Undress

Apl berkuasa AI untuk mencipta foto bogel yang realistik

AI Clothes Remover

AI Clothes Remover

Alat AI dalam talian untuk mengeluarkan pakaian daripada foto.

Undress AI Tool

Undress AI Tool

Gambar buka pakaian secara percuma

Clothoff.io

Clothoff.io

Penyingkiran pakaian AI

Video Face Swap

Video Face Swap

Tukar muka dalam mana-mana video dengan mudah menggunakan alat tukar muka AI percuma kami!

Alat panas

Notepad++7.3.1

Notepad++7.3.1

Editor kod yang mudah digunakan dan percuma

SublimeText3 versi Cina

SublimeText3 versi Cina

Versi Cina, sangat mudah digunakan

Hantar Studio 13.0.1

Hantar Studio 13.0.1

Persekitaran pembangunan bersepadu PHP yang berkuasa

Dreamweaver CS6

Dreamweaver CS6

Alat pembangunan web visual

SublimeText3 versi Mac

SublimeText3 versi Mac

Perisian penyuntingan kod peringkat Tuhan (SublimeText3)

Bagaimana untuk menyelesaikan masalah kebenaran yang dihadapi semasa melihat versi Python di Terminal Linux? Bagaimana untuk menyelesaikan masalah kebenaran yang dihadapi semasa melihat versi Python di Terminal Linux? Apr 01, 2025 pm 05:09 PM

Penyelesaian kepada Isu Kebenaran Semasa Melihat Versi Python di Terminal Linux Apabila anda cuba melihat versi Python di Terminal Linux, masukkan Python ...

Bagaimana untuk mengelakkan dikesan oleh penyemak imbas apabila menggunakan fiddler di mana-mana untuk membaca lelaki-dalam-tengah? Bagaimana untuk mengelakkan dikesan oleh penyemak imbas apabila menggunakan fiddler di mana-mana untuk membaca lelaki-dalam-tengah? Apr 02, 2025 am 07:15 AM

Cara mengelakkan dikesan semasa menggunakan fiddlerevery di mana untuk bacaan lelaki-dalam-pertengahan apabila anda menggunakan fiddlerevery di mana ...

Bagaimana cara menyalin seluruh lajur satu data ke dalam data data lain dengan struktur yang berbeza di Python? Bagaimana cara menyalin seluruh lajur satu data ke dalam data data lain dengan struktur yang berbeza di Python? Apr 01, 2025 pm 11:15 PM

Apabila menggunakan Perpustakaan Pandas Python, bagaimana untuk menyalin seluruh lajur antara dua data data dengan struktur yang berbeza adalah masalah biasa. Katakan kita mempunyai dua DAT ...

Bagaimanakah uvicorn terus mendengar permintaan http tanpa serving_forever ()? Bagaimanakah uvicorn terus mendengar permintaan http tanpa serving_forever ()? Apr 01, 2025 pm 10:51 PM

Bagaimanakah Uvicorn terus mendengar permintaan HTTP? Uvicorn adalah pelayan web ringan berdasarkan ASGI. Salah satu fungsi terasnya ialah mendengar permintaan HTTP dan teruskan ...

Bagaimana Mengajar Asas Pengaturcaraan Pemula Komputer Dalam Kaedah Projek dan Masalah Dikemukakan Dalam masa 10 Jam? Bagaimana Mengajar Asas Pengaturcaraan Pemula Komputer Dalam Kaedah Projek dan Masalah Dikemukakan Dalam masa 10 Jam? Apr 02, 2025 am 07:18 AM

Bagaimana Mengajar Asas Pengaturcaraan Pemula Komputer Dalam masa 10 jam? Sekiranya anda hanya mempunyai 10 jam untuk mengajar pemula komputer beberapa pengetahuan pengaturcaraan, apa yang akan anda pilih untuk mengajar ...

Bagaimana untuk mendapatkan data berita yang melangkaui mekanisme anti-crawler Investing.com? Bagaimana untuk mendapatkan data berita yang melangkaui mekanisme anti-crawler Investing.com? Apr 02, 2025 am 07:03 AM

Memahami Strategi Anti-Crawling of Investing.com Ramai orang sering cuba merangkak data berita dari Investing.com (https://cn.investing.com/news/latest-news) ...

See all articles