Deepseek, ein chinesisches KI-Startup, war kürzlich "Open Source".
Deepseek veröffentlichte am vergangenen Samstag seinen ersten Artikel über die Zhihu-Plattform und gab die Details der Kosten für die Kosten für die Kosten für die Kosten für die Kosten für die Kosten für die Kosten für die Kosten für die Kosten von Deepseek-R1, die theoretische Einnahmen pro Tag berechnet werden.
Laut der offiziellen Offenlegung von Deepseek verwenden alle Dienste von Deepseek V3 und R1 H800 GPU unter Verwendung einer konsistenten Genauigkeit mit dem Training, dh Matrixberechnung und Versandübertragung, ein konsequentes FP8-Format mit konsistenten Ausbildung und Kernantrieb und Core-Tent-Berechnung und Mischgiebinvermittlung.
In the statistical cycle of the last 24 hours (12:00 on February 27, 2025 to 12:00 on February 28), if the GPU rental cost is calculated at US$2/hour, the average daily cost is US$87,072, and if all input/output tokens are priced at R1 (input 1 yuan/million token, output 16 yuan/million token), the daily income can reach US$560,027 (about NT$18.65 million), and the cost interest rate is as high as 545%.
Nach dem Lesen der oben genannten Daten wies Menloventures Investor Deedy darauf hin, dass die Geschäftseffizienz des Gewinnrates von über 500% ein Unternehmen sein wird, das in den USA mehr als 10 Milliarden US -Dollar im Wert von mehr als 10 Milliarden US -Dollar ist.
Yuan Jinhui, Gründer des in Silizium ansässigen Mobiltelefons Chinas, drückte zum ersten Mal seine Gefühle aus: "Deepseeks offizielle Offenlegung der Kosten und Vorteile des groß angelegten Einsatzes hat die Wahrnehmung vieler Menschen erneut untergraben."
Die hohe Gewinnrate von Deepseek ergibt sich aus seinem innovativen Inferenzsystemdesign mit drei technischen Säulen: groß angelegte Cross-Node-Expertenparallelität (EP), Überlappung der Kommunikation und Optimierung des Lastausgleichs. EP verbessert den Durchsatz und die Reaktionsgeschwindigkeit für die Modellsparsity (nur 8/256 Experten werden pro Schicht gestartet), die EP -Strategie wird verwendet, um die Gesamt -Chargengröße zu erweitern, um sicherzustellen, dass jeder Experte ausreichend Computerlast erhält, die GPU -Auslastung erheblich verbessert und die Bereitstellungseinheit dynamisch anpasst (wie 4 Knoten in der Stufe der Kodes und der Aufgabe von Bildern.
Kurz gesagt, EP ist wie "Multi-Person-Zusammenarbeit", die "Experten" im Modell auf mehrere GPUs für Berechnungen verteilt, die Chargengröße erheblich verbessert, die GPU-Rechenleistung drückt und gleichzeitig Experten verteilt, die Speicherdruck reagiert und schneller reagiert.
Deepseek fährt die Kosten auf technischer Ebene sowie die Allokation von Tag- und Nachtressourcen, die Inferenzdienste während der Spitzenzeiten vollständig unterstützt, und die Idle -Knoten werden für F & E und das Training übertragen, wodurch die Auslastung der Hardware maximiert wird, und der Cache -Trefferzusatz erreicht 56,3%. .
Einige Analysten sagen, dass die von Deepseek offengelegten Daten nicht nur die kommerzielle Machbarkeit des technischen Weges überprüft, sondern auch einen Maßstab für die effiziente Rentabilität der Branche festlegen. In Bezug auf die Vorteile der Inferenzpreise beträgt die API-Preisgestaltung von Deepseek-R1 nur etwa ein 7 bis halbes OpenAI O3-Mini, und die Marktdurchdringung von kostengünstigen Strategien beschleunigen.
Andere Analysten wiesen darauf hin, dass Deepseeks "transparente" Offenlegung nicht nur sein technisches Stärke und sein Geschäftspotential demonstriert, sondern auch ein klares Signal an die Branche sendet, dh der Gewinnzyklus von AI -Modellen hat von den Idealen in die Realität in die Realität gekommen, was einen wesentlichen Wendepunkt in der KI -Technologie vom Labor zur Industrialisierung darstellt.
Deepseek gab jedoch offiziell zu, dass es tatsächlich nicht so viel Einnahmen gab, da V3 günstiger war und die Dienste nur einen Teil der Zeit auszurichten konnten, und es gab nachts Rabatte.
CITIC Securities ist der Ansicht, dass die Best Practices von Deepseek bei der Reduzierung von Modellschulungskosten voraussichtlich die Technologie-Riesen dazu anregen, eine wirtschaftlichere Möglichkeit zur Beschleunigung der Exploration und Erforschung modernster Modelle zu beschleunigen. Die zunehmende Wirkung von Skalenerträgen, die durch Algorithmus-Training sowie das Jevins-Paradoxon, das der Reduzierung der Rechenkosten für die Einheit entspricht, darstellen, stellen alle dar, dass mittel- und kurzfristige Dimensionstechnologie-Riesen weiterhin kontinuierliche Anlagen auf dem Gebiet der AI-Rechenleistung führen, und Skalierungsinvestitionen werden immer noch ein hochdetertisches Ereignis sein.
Das obige ist der detaillierte Inhalt von545%! Deepseek hat Experten für die Kostengewinnmarge zuerst offengelegt: Wenn es bereits ein Unternehmen ist, das mehr als 10 Milliarden US -Dollar in den USA im Wert von mehr als 10 Milliarden US -Dollar ist. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!