Token zählen: Durch die Details sortieren
Die Frauen der Six Triple Eight standen vor einer gewaltigen Herausforderung: Sie mussten unter strengen Zeitvorgaben unvollständige Adressen, Spitznamen und verschmierte Handschriften entziffern. Auch bei der Feinabstimmung benutzerdefinierter Daten mit OpenAI-Daten ist das Verständnis der Token-Nutzung von entscheidender Bedeutung – nicht nur, um sicherzustellen, dass das Modell komplexe Aufgaben bewältigen kann, sondern auch, um die Kosten effektiv zu verwalten.
Mithilfe von Tiktoken berechnen wir die Token-Anzahl in unseren Textdaten, um innerhalb der Token-Grenzen von OpenAI zu bleiben und die Effizienz zu optimieren. Die Feinabstimmung eines Modells ist nicht nur eine technische Herausforderung; es hat finanzielle Auswirkungen. Die Preisgestaltung von OpenAI zeigt beispielsweise, dass die Feinabstimmung von GPT-3.5 Turbo 0,008 US-Dollar pro 1.000 Token kostet. Um es ins rechte Licht zu rücken: 1.000 Token entsprechen ungefähr 750 Wörtern.
Kurz gesagt, die Feinabstimmung kann teuer sein, da die Kosten direkt mit der Token-Nutzung skalieren. Vorausplanung und Budgetierung – so wie die Six Triple Eight ihren Rückstand akribisch sortiert haben – sind der Schlüssel zum Erfolg.
Code
import tiktoken def cal_num_tokens_from_row(string:str,encoding_name:str)-> int: encoding = tiktoken.encoding_for_model(encoding_name) num_tokens = len(encoding.encode(string)) return num_tokens def cal_num_tokens_from_df(df,encoding_name:str) -> int: total_tokens = 0 for text in df['text']: total_tokens += cal_num_tokens_from_row(text,encoding_name) return total_tokens total_tokens = cal_num_tokens_from_df(df,'gpt-3.5-turbo') print(f"total {total_tokens}")
Basierend auf der Gesamtzahl der Token könnte die Feinabstimmung etwa 8 bis 9 US-Dollar kosten, was für eine Einzelperson unerschwinglich sein könnte. Planung und Budgetierung sind unerlässlich, um diese Kosten effektiv zu verwalten.
Das obige ist der detaillierte Inhalt vonToken zählen: Durch die Details sortieren. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wie kann man nicht erkannt werden, wenn Sie Fiddlereverywhere für Man-in-the-Middle-Lesungen verwenden, wenn Sie FiddLereverywhere verwenden ...

Fastapi ...

Verwenden Sie Python im Linux -Terminal ...

Wie lehre ich innerhalb von 10 Stunden die Grundlagen für Computer -Anfänger für Programmierungen? Wenn Sie nur 10 Stunden Zeit haben, um Computer -Anfänger zu unterrichten, was Sie mit Programmierkenntnissen unterrichten möchten, was würden Sie dann beibringen ...

Über Pythonasyncio ...

Verständnis der Anti-Crawling-Strategie von Investing.com Viele Menschen versuchen oft, Nachrichten von Investing.com (https://cn.investing.com/news/latest-news) zu kriechen ...

Laden Sie die Gurkendatei in Python 3.6 Umgebungsfehler: ModulenotFoundError: Nomodulenamed ...

Diskussion über die Gründe, warum Pipeline -Dateien beim Lernen und Verwendung von Scapy -Crawlern für anhaltende Datenspeicher nicht geschrieben werden können, können Sie auf Pipeline -Dateien begegnen ...
