Teil 1 behandelte PostgreSQL mit pgvector-Setup und Teil 2 implementierte die Vektorsuche mithilfe von OpenAI-Einbettungen. In diesem letzten Teil wird gezeigt, wie Sie die Vektorsuche lokal mit Ollama ausführen! ✨
Ollama ermöglicht Ihnen die lokale Ausführung von KI-Modellen mit:
Wir verwenden das nomic-embed-text-Modell in Ollama, das 768-dimensionale Vektoren erstellt (im Vergleich zu den 1536 Dimensionen von OpenAI).
Um Ollama zu Ihrem Docker-Setup hinzuzufügen, fügen Sie diesen Dienst zu compose.yml hinzu:
services: db: # ... (existing db service) ollama: image: ollama/ollama container_name: ollama-service ports: - "11434:11434" volumes: - ollama_data:/root/.ollama data_loader: # ... (existing data_loader service) environment: - OLLAMA_HOST=ollama depends_on: - db - ollama volumes: pgdata: ollama_data:
Dann starten Sie die Dienste und rufen das Modell ab:
docker compose up -d # Pull the embedding model docker compose exec ollama ollama pull nomic-embed-text # Test embedding generation curl http://localhost:11434/api/embed -d '{ "model": "nomic-embed-text", "input": "Hello World" }'
Aktualisieren Sie die Datenbank, um Ollama-Einbettungen zu speichern:
-- Connect to the database docker compose exec db psql -U postgres -d example_db -- Add a column for Ollama embeddings ALTER TABLE items ADD COLUMN embedding_ollama vector(768);
Aktualisieren Sie bei Neuinstallationen postgres/schema.sql:
CREATE TABLE items ( id SERIAL PRIMARY KEY, name VARCHAR(255) NOT NULL, item_data JSONB, embedding vector(1536), # OpenAI embedding_ollama vector(768) # Ollama );
Anforderungen.txt aktualisieren, um die Ollama-Python-Bibliothek zu installieren:
ollama==0.3.3
Hier ist ein Beispiel-Update für load_data.py zum Hinzufügen von Ollama-Einbettungen:
import ollama # New import def get_embedding_ollama(text: str): """Generate embedding using Ollama API""" response = ollama.embed( model='nomic-embed-text', input=text ) return response["embeddings"][0] def load_books_to_db(): """Load books with embeddings into PostgreSQL""" books = fetch_books() for book in books: description = ( f"Book titled '{book['title']}' by {', '.join(book['authors'])}. " f"Published in {book['first_publish_year']}. " f"This is a book about {book['subject']}." ) # Generate embeddings with both OpenAI and Ollama embedding = get_embedding(description) # OpenAI embedding_ollama = get_embedding_ollama(description) # Ollama # Store in the database store_book(book["title"], json.dumps(book), embedding, embedding_ollama)
Beachten Sie, dass dies aus Gründen der Übersichtlichkeit eine vereinfachte Version ist. Der vollständige Quellcode ist hier.
Wie Sie sehen können, ähnelt die Ollama-API-Struktur der von OpenAI!
Suchanfrage zum Abrufen ähnlicher Elemente mithilfe von Ollama-Einbettungen:
-- View first 5 dimensions of an embedding SELECT name, (replace(replace(embedding_ollama::text, '[', '{'), ']', '}')::float[])[1:5] as first_dimensions FROM items; -- Search for books about web development: WITH web_book AS ( SELECT embedding_ollama FROM items WHERE name LIKE '%Web%' LIMIT 1 ) SELECT item_data->>'title' as title, item_data->>'authors' as authors, embedding_ollama <=> (SELECT embedding_ollama FROM web_book) as similarity FROM items ORDER BY similarity LIMIT 3;
CREATE INDEX ON items USING ivfflat (embedding_ollama vector_cosine_ops) WITH (lists = 100);
Bei der Verarbeitung großer Datensätze kann die GPU-Unterstützung die Einbettungsgenerierung erheblich beschleunigen. Einzelheiten finden Sie im Ollama Docker-Image.
Die Ollama-Bibliothek muss wissen, wo sie den Ollama-Dienst finden kann. Legen Sie die Umgebungsvariable OLLAMA_HOST im data_loader-Dienst fest:
data_loader: environment: - OLLAMA_HOST=ollama
Modell manuell ziehen:
docker compose exec ollama ollama pull nomic-embed-text
Alternativ können Sie mit der Funktion ollama.pull(
Feature | OpenAI | Ollama |
---|---|---|
Vector Dimensions | 1536 | 768 |
Privacy | Requires API calls | Fully local |
Cost | Pay per API call | Free |
Speed | Network dependent | ~50ms/query |
Setup | API key needed | Docker only |
Dieses Tutorial behandelte nur die Einrichtung einer lokalen Vektorsuche mit Ollama. Reale Anwendungen umfassen oft zusätzliche Funktionen wie:
Der vollständige Quellcode, einschließlich einer einfachen, mit FastAPI erstellten API, ist auf GitHub verfügbar. PRs und Feedback sind willkommen!
Fragen oder Feedback? Hinterlassen Sie unten einen Kommentar! ?
Das obige ist der detaillierte Inhalt vonTeil der Implementierung der Vektorsuche mit Ollama. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!