DeepSeek, seorang inovator AI Cina, telah memberi kesan yang ketara kepada landskap AI global, menyebabkan penurunan $ 1 trilion dalam penilaian pasaran saham AS dan gergasi teknologi yang mengganggu seperti Nvidia dan OpenAI. Peningkatan pesatnya adalah disebabkan oleh penjanaan teks, penalaran, penglihatan, dan model generasi imejnya. Sorotan baru-baru ini ialah pelancaran siri janus model multimodalnya. Butiran tutorial ini menubuhkan bekas Docker tempatan untuk menjalankan model Janus dan meneroka keupayaannya.
Panduan ini merangkumi menubuhkan projek Janus, membina bekas docker untuk pelaksanaan tempatan, dan menguji keupayaan pemprosesan imej dan teksnya. Penjelajahan lanjut mengenai model mengganggu DeepSeek boleh didapati melalui sumber -sumber ini:
1. Janus: Pendekatan Bersepadu
2. Janusflow: Integrasi aliran diperbaiki
3. Janus-Pro: Prestasi yang dioptimumkan
Sumber: DeepSeek-ai/Janus
Untuk menyelam yang lebih mendalam ke dalam siri Janus, kaedah akses, dan perbandingan dengan Openai's Dall-E 3, lihat Deepseek's Janus-Pro: Ciri-ciri, Dall-E 3 Perbandingan & Lagi.
Walaupun Janus adalah model yang agak baru, kekurangan versi kuantitatif yang tersedia atau aplikasi tempatan untuk penggunaan desktop/komputer riba yang mudah, repositori GitHub menawarkan demo aplikasi Web Gradio. Walau bagaimanapun, demo ini sering menemui konflik pakej. Projek ini menangani ini dengan mengubahsuai kod, membina imej docker tersuai, dan menjalankannya secara tempatan menggunakan desktop docker.
Mulailah dengan memuat turun dan memasang versi desktop Docker terkini dari laman web Docker rasmi.
Pengguna Windows:Pengguna Windows juga memerlukan subsistem Windows untuk Linux (WSL). Pasangnya melalui terminal anda dengan:
2. Pengklonan Repositori Janus<code>wsl --install</code>
3. Mengubah kod demo
<code>git clone https://github.com/deepseek-ai/Janus.git cd Janus</code>
. Buat perubahan ini: demo
app_januspro.py
deepseek-ai/Janus-Pro-7B
deepseek-ai/Janus-Pro-1B
demo.queue
<code>demo.queue(concurrency_count=1, max_size=10).launch( server_name="0.0.0.0", server_port=7860 )</code>
4. Membuat Imej Docker
Buat
dalam direktori root projek dengan kandungan ini: Dockerfile ini akan: Dockerfile
<code># Use the PyTorch base image FROM pytorch/pytorch:latest # Set the working directory inside the container WORKDIR /app # Copy the current directory into the container COPY . /app # Install necessary Python packages RUN pip install -e .[gradio] # Set the entrypoint for the container to launch your Gradio app CMD ["python", "demo/app_januspro.py"]</code>
Tetapkan direktori kerja bekas.
Dockerfile
<code>docker build -t janus .</code>
Mulakan bekas dengan sokongan GPU, pemetaan pelabuhan, dan penyimpanan berterusan:
Memantau kemajuan dalam tab "Kontena" dan "Log" Aplikasi Desktop. Model muat turun dari hab muka pelukan akan dapat dilihat dalam log.
Akses permohonan di: http://localhost:7860/
. Untuk menyelesaikan masalah, rujuk projek Janus yang dikemas kini di kingabzpro/Janus: Janus-Series
.
Aplikasi web menyediakan antara muka mesra pengguna. Bahagian ini menunjukkan pemahaman multimodal Janus Pro dan generasi teks-ke-imej.
untuk menguji pemahaman multimodal, memuat naik imej dan meminta penjelasan. Walaupun dengan model 1B yang lebih kecil, hasilnya sangat tepat.
ujian generasi teks-ke-imej
Imej yang dihasilkan dapat dibandingkan dengan kualiti dan terperinci kepada penyebaran stabil XL. Gegaran yang lebih kompleks juga diuji di bawah, menunjukkan keupayaan model untuk mengendalikan deskripsi yang rumit.
Kesimpulan
Untuk ujian komprehensif, DeepSeek's Hugging Face Spaces Deployment () menyediakan akses kepada keupayaan model penuh. Ketepatan model Janus Pro, walaupun dengan varian yang lebih kecil, patut diberi perhatian.
Atas ialah kandungan terperinci Cara Menggunakan Deepseek Janus-Pro Secara Tempatan. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!