Cara Menggunakan Apl AI (dengan Large Deps) ke AWS Lambda

DDD
Lepaskan: 2024-10-10 06:12:30
asal
775 orang telah melayarinya

How to Deploy an AI App (w/ Large Deps) to AWS Lambda

Baru-baru ini saya meluangkan masa dua jam mendapatkan apl LlamaIndex ringkas untuk dijalankan pada AWS Lambda. Walaupun fungsi itu sendiri hanya terdiri daripada beberapa baris kod Python (seperti yang ditunjukkan di bawah), mengurus kebergantungan dan penggunaan boleh menjadi rumit.

import json
from llama_index.llms.openai import OpenAI

llm=OpenAI(model="gpt-4o-mini")

def lambda_handler(event, context):
    response = llm.complete("What public transportation might be available in a city?")
    return {
        'statusCode': 200,
        'body': str(response),
    }

Salin selepas log masuk

Berikut ialah beberapa petua utama yang membantu saya:

Mula-mula, pasang pakej untuk platform yang betul. Adalah penting untuk memasang semua pakej untuk platform sasaran "manylinux2014_x86_64". Jika tidak, pakej tertentu mungkin tidak serasi dengan masa jalan AWS Lambda. Untuk memastikan keserasian, pasang kebergantungan dengan arahan berikut:

pip install -r requirements.txt --platform manylinux2014_x86_64 --target ./deps --only-binary=:all:
Salin selepas log masuk

Kedua, Lambda mempunyai had 250MB untuk jumlah saiz pakej kod, yang boleh menjadi isu dengan cepat jika anda menggunakan LlamaIndex atau kebergantungan besar yang lain. Jika pakej anda melebihi had ini, semak fail terbesar dalam folder dependensi anda:

du -h -d 2 | sort -hr | head -n20
Salin selepas log masuk

Dalam kes saya, saya mendapati bahawa direktori panda/ujian mengambil kira-kira 35MB ruang, yang tidak diperlukan untuk fungsi saya, jadi saya mengalih keluarnya untuk mengembalikan saiz pakej dalam had.

rm -r deps/pandas/tests
Salin selepas log masuk

Kemudian, zip semuanya dan muat naik melalui S3. Selepas memangkas fail yang tidak diperlukan, buat arkib zip yang mengandungi kedua-dua kod dan kebergantungan anda. Memandangkan konsol web Lambda mempunyai had muat naik 50MB, anda perlu memuat naik fail zip yang lebih besar ke baldi S3 dan menggunakan URI S3 untuk menggunakan fungsi tersebut.

zip -r test_lambda.zip data/ lambda_function.py
cd deps/
zip -r ../test_lambda.zip .
Salin selepas log masuk

Akhir sekali, laraskan tetapan Lambda anda sebelum digunakan. Secara lalai, fungsi Lambda hanya diperuntukkan memori 128MB dan tamat masa 3 saat, yang tidak mencukupi untuk banyak aplikasi AI yang melibatkan kebergantungan besar dan memanggil LLM. Saya akan meningkatkan memori kepada 512MB dan memanjangkan tamat masa kepada 30 saat. Selain itu, jangan lupa untuk menetapkan pembolehubah persekitaran penting seperti Kunci API OpenAI anda.

Saya mengambil masa yang agak lama untuk memikirkan cara yang betul untuk memasang pakej dan menggabungkan semuanya bersama-sama untuk Lambda. AWS Lambda mesra pengguna untuk skrip asas, tetapi apabila anda menambah kebergantungan yang lebih besar, keadaan menjadi lebih rumit.

Berikut ialah urutan terakhir langkah:

# Install dependencies
pip install -r requirements.txt --platform manylinux2014_x86_64 --target ./deps --only-binary=:all:

# Create a zip file for code and data
zip -r test_lambda.zip data/ lambda_function.py

# Include dependencies in the zip file, while removing large unused files
cd deps/
rm -r pandas/tests
zip -r ../test_lambda.zip .
Salin selepas log masuk

p.s., saya juga cuba menggunakan fungsi serupa pada DBOS Cloud, dan ia hanya mengambil satu arahan:

dbos-cloud app deploy
Salin selepas log masuk

Dalam DBOS, pengurusan pergantungan dikendalikan secara automatik melalui fail requirements.txt dan pembolehubah persekitaran ditetapkan dalam dbos-config.yaml. Saya mungkin berat sebelah, tetapi saya menikmati kesederhanaan proses penggunaan DBOS Cloud.

Atas ialah kandungan terperinci Cara Menggunakan Apl AI (dengan Large Deps) ke AWS Lambda. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

sumber:dev.to
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan
Tentang kita Penafian Sitemap
Laman web PHP Cina:Latihan PHP dalam talian kebajikan awam,Bantu pelajar PHP berkembang dengan cepat!