iFlytek reagiert auf „Beschuss' und entzaubert den Hype um KI-Großmodelle-KI-php.cn

Heim

Technologie-Peripheriegeräte

iFlytek reagiert auf „Beschuss' und entzaubert den Hype um KI-Großmodelle

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 05, 2023 pm 07:00 PM

ai大模型套壳祛魅

Artikel|Digital Intelligence Business Show Cui Si

Herausgeber|Zhang Hongyi

„Welche Beziehung besteht zwischen Spark Model und OpenAI?“

„Ich habe nichts mit OpenAI zu tun. Ich bin das kognitive Modell iFlytek Spark. Es wurde unabhängig von einem Team herausragender Wissenschaftler, Ingenieure und Linguisten für künstliche Intelligenz von iFlytek entwickelt.“

Bald beantwortete die „Business Show“ die vom Spark Cognitive Large Model eingegebenen Fragen. Dies steht im Widerspruch zu einem aktuellen Gerücht über das iFlytek Spark-Modell.

Kürzlich haben einige Internetnutzer entdeckt, dass das iFlytek Spark-Modell in einigen „Q&A“-Inhalten auftauchen wird, wie zum Beispiel „Ich wurde von OpenAI entwickelt“. Dies führte zu einem Artikel über „Das iFlytek Spark-Modell wird als Cover für OpenAIs ChatGPT in Frage gestellt.“ Die Nachricht verbreitete sich.

Am 11. Mai erklärte iFlytek im neuesten Investor-Relations-Aktivitätsbericht, dass das Spark-Modell, das „ChatGPT von OpenAI beschießt“, weder sachlich noch logisch sei.

iFlytek gab ausdrücklich an, dass das iFlytek Spark-Modell nicht schneller reagieren könnte als ChatGPT, wenn es eine Shell von ChatGPT wäre. usw. Die Ergebnisse sind besser als die von ChatGPT.

Wir haben Grund zu der Annahme, dass iFlytek zum jetzigen Zeitpunkt mehr als jedes andere Unternehmen die Geschichte eines großen Modells braucht und nicht einen „Granatenunfall“. Unabhängig von den Vorzügen des großen Modells selbst zeigt die schnelle Widerlegung des Gerüchts durch iFlytek, wie wichtig das Spark-Modell für das Unternehmen ist. Die großen Modelle hatten sowohl im Quartal als auch darüber hinaus eine beispiellose positive Wirkung auf die Aktienkurse.

Ende April dieses Jahres veröffentlichte iFlytek seinen Finanzbericht für 2022 und den Bericht für das erste Quartal 2023. Der Finanzbericht zeigte, dass der Nettogewinn stark zurückging. Der Markt schien sofort das meiste Vertrauen verloren zu haben, und der Aktienkurs fiel den ganzen Weg. Erst am 6. Mai (Samstag) veröffentlichte iFlytek das Spark-Modell. Nach der Markteröffnung am 8. Mai begann der Aktienkurs um 10 % zu steigen. Der Markt scheint wieder Vertrauen in dieses Unternehmen gewonnen zu haben.

Bei der Einführung großer Modelle und dem Vorfall, in Frage gestellt zu werden, ob „OpenAI enthalten“ sei, muss sich iFlytek auch mit einem gemeinsamen KI-Thema auseinandersetzen: Große Modelle versammeln sich, und es ist an der Zeit, rational zu enttäuschen.

Im Zeitalter der Großmodelle ist iFlytek kein „einsamer Mutiger“. Seit der Veröffentlichung von ChatGPT hat das technologische Wettrüsten nie aufgehört, und sein Einfluss hat sich auch in China verstärkt. Vor einiger Zeit sind große Modelle ausgebrochen, und sie wurden als solche bewertet „ziemlich zehn Jahre alt“.

Unvollständigen Statistiken zufolge haben in nur 4 Monaten nach der Veröffentlichung von ChatGPT mindestens mehr als 30 inländische Forschungs- und Entwicklungseinrichtungen und Unternehmen nach der Veröffentlichung von ChatGPT große Modelle und verwandte Produkte ihrer eigenen Marken auf den Markt gebracht.

Da viele Unternehmen behaupten, „inländische Pioniere“ zu sein, ist die ChatGPT-ähnliche Technologie im gesamten Technologiekreis weit verbreitet, und auch der Kapitalmarkt beginnt zu schwanken. Die Berichterstattung in den Medien rund um das große Modell war überwältigend, es folgte eine kurze Stille. Und die nächste Welle ist höchstwahrscheinlich noch im Anmarsch.

Die Chancen, die große Models bieten, liegen auf der Hand, aber wer schafft es in diesem verrückten Wettbewerb wirklich bis zum Ende? Was ist im entscheidenden Kampf um die Zukunft die eigentliche Kernwettbewerbsfähigkeit jedes Unternehmens?

Nach den historischen Gesetzen der Geschäftsentwicklung zu urteilen, wird der Markt nach der Hektik zusammenbrechen und sprudeln, und die Hektik der Großmodelle kann nicht ewig anhalten. Um die Chancen der KI-Technologie für den industriellen Wandel wirklich nutzen zu können, müssen wir die zentralen Veränderungen verstehen, die durch groß angelegte Modelle hervorgerufen werden, und gelassen denken.

01 Über ChatGPT hinaus?

Derzeit liegt das Spark Cognitive Large Model im Land weit vorne. Seine chinesische Leistung hat ChatGPT übertroffen, und auch seine englische Leistung liegt nahe an der Spitzenposition. „Sagte Liu Qingfeng selbstbewusst auf der Konferenz zur Einführung des kognitiven Modells iFlytek Spark.

Als fünftes Unternehmen, das nach Baidu, Alibaba, SenseTime und Kunlun Wanwei offiziell große Modelle auf den Markt bringt, konnte iFlytek es kaum erwarten, seine leistungsstarken Fähigkeiten zu präsentieren, sobald es auf der Bildfläche erschien.

Liu Qingfeng leitete die gesamte Pressekonferenz und demonstrierte zusammen mit Liu Cong, Direktor des iFlytek Research Institute von HKUST, eine Reihe von Fähigkeiten, darunter Texterstellung, Sprachverständnis, Wissensfragen und -antworten, logisches Denken, mathematische Fähigkeiten, Programmierfähigkeiten usw .

Während der Live-Demonstration fragte Liu Cong: „Warum heißt du Xinghuo?“ „Wenn ein junger Mann sich mit seiner Freundin streitet, sollte er dann lieber sterben oder bereit sein, sich zu beugen und zu recken?“ Olympische Spiele in Peking?“ usw. Solche seltsamen Fragen „beantwortete“ Xinghuo schnell und gab passende Antworten.

In Bezug auf die mathematischen Fähigkeiten fragte Liu Cong auch: „Es gibt drei Arten von Blumen im Blumenbeet, insgesamt 88 Blumen. Darunter ist die Anzahl der Rosenblüten viermal so hoch wie die der Chrysanthemen und die Anzahl der Pfingstrosen.“ ist fünfmal so groß wie Chrysanthemen und zweimal weniger. Wie viele Blumen gibt es im Blumenbeet? Diese Art von Rechenaufgabe. Auch Xinghuo gab schnell die Antwort und listete die relevanten Schritte zur Lösung des Problems auf.

Liu Qingfeng sagte dann, dass mathematische Fähigkeiten in gewissem Maße die Intelligenz eines großen Modells widerspiegeln. Das iFlytek Spark-Modell liegt nicht nur weit vorne unter den heimischen Systemen, sondern hat auch ChatGPT überholt.

In diesem Zusammenhang führte die „Business Show“ auch mehrere Runden von „Grabungstests“ durch, wie zum Beispiel die Frage „In welchem Jahr hat Yao Ming den Titel des asiatischen Fußballers gewonnen?“ „In wie vielen Jahren hat Fan Zhiyi gedient?“ die NBA? „Wie viele Tore?“ und andere Fragen. Xinghuo identifizierte die von Menschenhand geschaffenen „Fallen“ genau und gab entsprechende Antworten.

iFlytek reagiert auf „Beschuss und entzaubert den Hype um KI-Großmodelle

Dies zeigt, dass Xinghuo eine gewisse Schulung zu Fragen des gesunden Menschenverstandes absolviert hat und über bestimmte Fähigkeiten zur Fehlerkorrektur verfügt.

Für die gleiche Frage wurde auch „Business Show“ über ChatGPT-3 getestet. Es gab zwar auch passende Antworten, war aber hinsichtlich des Informationsreichtums nicht so umfassend.

iFlytek reagiert auf „Beschuss und entzaubert den Hype um KI-Großmodelle

In Bezug auf die mathematischen Fähigkeiten wurden in der „Business Show“ auch „Hühner und Kaninchen im selben Käfig“ getestet. Insgesamt sind es 25 Hühner und Kaninchen, und der Käfig ist 74 Fuß lang. Wie viele Hühner und wie viele Gibt es Kaninchen? „Wenn eine Aktie heute um 10 % steigt und morgen um 10 % fällt, machen Sie dann einen Gewinn oder verlieren Sie?“ Auch Xinghuo gab schnell die richtige Antwort.

iFlytek reagiert auf „Beschuss und entzaubert den Hype um KI-Großmodelle

„Business Show“ stellte ChatGPT-3 die gleichen mathematischen Fragen. In dieser Hinsicht zeigten die Ergebnisse, dass die Antworten von ChatGPT-3 logischer waren. Letzterer gibt zunächst eine Schlussfolgerung und gibt dann konkrete Beispiele. Darüber hinaus werden erweiterte Fragen gestellt, um Fragen zu beantworten und Zweifel in Verbindung mit der ursprünglichen Frage auszuräumen.

iFlytek reagiert auf „Beschuss und entzaubert den Hype um KI-Großmodelle

Xinghuo unterstützt auch Sprachfragen und -ausgaben, d.

„Business Show“ fragte per Stimme „Hühner und Kaninchen teilen sich einen Käfig. Es gibt 35 Hühner und 94 Beine im Käfig. Wie viele Hühner und Kaninchen gibt es insgesamt?“ „China hat den Tennis Grand Slam Professional Who gewonnen.“ sind die Spieler?" und andere Fragen. Xinghuo erkannte auch den Sprachinhalt genau und gab entsprechende Antworten.

Dieser Vorgang erfordert jedoch, dass der Fragesteller sehr langsam und Wort für Wort in Standard-Mandarin spricht. Andernfalls kann Spark den entsprechenden Text möglicherweise nicht genau erkennen oder die Texterkennung ist möglicherweise ungenau, was zu falschen Antworten führt .

Nach mehreren Testrunden ist „Business Show“ davon überzeugt, dass Spark über bestimmte Funktionen für große Sprachmodelle verfügt und in bestimmten spezifischen Bereichen seinen eigenen Geschäftswert erzielen kann.

Auf der Pressekonferenz stellte iFlytek auch eine Reihe von Produkten vor, die das Spark-Modell kombinieren. Beispielsweise kombiniert die Smart-Office-Funktion von iFlytek Echtzeit-Sprachtranskription mit papierähnlichem Schreiben auf dem Tintenbildschirm, um eine vollständige Integration von Besprechungsprotokollen zu ermöglichen . Ein optimiertes Besprechungsprotokoll; „Spark Large Model + Smart Cockpit“ bietet generative RPA (Robotic Process Automation) auf Basis großer Modelle. Dadurch sind digitale Mitarbeiter intelligenter...

Aber auch Liu Qingfeng selbst gab auf der Pressekonferenz zu: „Es gibt immer noch viele Mängel in der Großmodelltechnologie, die überwunden werden müssen. Zu diesen Problemen gehört, dass neues Wissen nicht rechtzeitig aktualisiert wird.“ Verwirrung sachlicher Fragen und Antworten, Fälschung von Geschichte und Handlungen in der traditionellen Kultur usw. Anschließend erwähnte er, dass die oben genannten Probleme in diesem Jahr erheblich verbessert werden.

Es wird davon ausgegangen, dass das Spark Cognitive Large Model im Dezember 2022 starten wird. Damals startete iFlytek die Technologieforschung für Großmodelle „1+N“. Unter diesen ist „1“ die Basisplattform für die Entwicklung allgemeiner kognitiv-intelligenter Großmodellalgorithmen und effizienter Trainingslösungen, und „N“ bezieht sich auf die Anwendung kognitiv-intelligenter Großmodelltechnologie in den Bereichen Bildung, medizinische Versorgung, Mensch-Computer-Interaktion, Büro, Übersetzung und andere Branchen.

In weniger als einem halben Jahr wurde das Spark Cognitive Large Model offiziell auf den Markt gebracht. Die kurze Entwicklungszeit und die überhastete Modellveröffentlichung führten direkt dazu, dass viele Unternehmen, darunter auch iFlytek, von der Außenwelt in Frage gestellt wurden.

In so kurzer Zeit markiert die Einführung von Spark nur einen neuen Ausgangspunkt, der noch mehrere Iterations- und Optimierungsrunden durchlaufen muss. Liu Qingfeng kündigte auf der Pressekonferenz den Entwicklungsplan des Spark Cognitive Model an: Am 9. Juni dieses Jahres wird das Spark Cognitive Model offene Fragen und Antworten durchbrechen und im August seine Mehrrunden-Dialogfähigkeiten und mathematischen Fähigkeiten verbessern Am 15. Oktober wird das Spark Cognitive Model eingeführt. Das Modell wird die Codierungsfunktionen durchbrechen und die multimodale Interaktion wird am 24. Oktober aktualisiert. Das allgemeine Modell des Spark Cognitive Large Model wird ChatGPT direkt vergleichen, wobei die chinesischen Fähigkeiten die letzteren und die englischen Fähigkeiten übertreffen äquivalent zu letzterem.

Dem Planungsdatum nach zu urteilen, hat iFlytek sogar das Datum festgelegt, was darauf hindeuten könnte, dass das Unternehmen bestrebt ist, seine Großmodellfähigkeiten in die Praxis umzusetzen und die Kommerzialisierung voranzutreiben. Die Branche geht davon aus, dass dies möglicherweise mit den schlechten Kommerzialisierungsfähigkeiten von iFlytek in den letzten Jahren zusammenhängt.

02 Große Models werden dringend benötigt, um „das Selbstvertrauen zu stärken“

Zuvor wurden die hervorragende Leistung und Rentabilität von iFlytek von der Branche oft gelobt. Nach zehn aufeinanderfolgenden Wachstumsjahren endete der Mythos jedoch im Jahr 2022.

Der Finanzbericht 2022 von iFlytek zeigt, dass das Unternehmen einen Umsatz von 18,82 Milliarden Yuan erzielte, was einer leichten Steigerung von 2,77 % gegenüber dem Vorjahr entspricht; der Bruttogewinn betrug 7,684 Milliarden Yuan, eine leichte Steigerung von 2 % gegenüber dem Vorjahr; Der der Muttergesellschaft zuzurechnende Nettogewinn belief sich auf 561 Millionen Yuan, was einem Rückgang von 6,394 % gegenüber dem Vorjahr entspricht, ohne Berücksichtigung des Nicht-Nettogewinns von 418 Millionen Yuan, was einem Rückgang von 57,31 % gegenüber dem Vorjahr entspricht.

Dieser Satz kann wie folgt umgeschrieben werden: Daten von iFlytek, die staatliche Subventionen einbeziehen, zeigen, dass die staatlichen Subventionen bis 2022 voraussichtlich 1,1 Milliarden Yuan erreichen werden. Gleichzeitig ist dies auch das erste Mal in den letzten fünf Jahren, dass die Wachstumsrate des Nettogewinns von iFlytek im Jahresvergleich zurückgegangen ist. Daten zeigen, dass die Nettogewinnwachstumsraten von iFlytek von 2018 bis 2022 24,71 %, 51,12 %, 66,48 %, 14,13 % bzw. -63,94 % betrugen.

Der Kapitalmarkt war von diesem Zeugnis ziemlich enttäuscht. Nach Veröffentlichung des Finanzberichts fiel der Aktienkurs von iFlytek um mehr als 9 %.

iFlytek nannte drei Gründe für eine so drastische Leistungsänderung.

Erstens sind es die Auswirkungen des allgemeinen Umfelds, dass „aufgrund des besonderen sozialen und wirtschaftlichen Umfelds im Dezember letzten Jahres und Januar dieses Jahres sowie der Feiertage zum Frühlingsfest einige Projekte fehlgeschlagen sind.“ nicht reibungslos und zeitnah befördert werden können.“

Zweitens geriet es nach der Aufnahme in die US-Entity List im Jahr 2019 am 7. Oktober 2022 erneut unter extremen Druck. Aufgrund von Anpassungen in der Lieferkette und damit verbundenen Vertragsunterzeichnungen verringerte sich das Auftragstempo im laufenden Quartal war betroffen.

Der letzte Punkt bezieht sich auf das Spark-Modell. iFlytek erwähnte, dass das im Dezember letzten Jahres gestartete „1+N Cognitive Intelligence Large Model Special Research Project“ Auswirkungen auf die aktuellen Gewinne hatte, was bestätigte, dass iFlytek stark in große Modelle investiert hat.

Auch in diesem Jahr wirken sich diese drei Hauptgründe weiterhin auf die Leistung von iFlytek aus.

Daten zeigen, dass iFlytek im ersten Quartal 2023 einen Umsatz von 2,888 Milliarden Yuan erzielte, ein Rückgang von 17,64 % im Vergleich zum Vorjahr; ein Nettoverlust von 57,895 Millionen Yuan, ein Nettogewinn von 110 Millionen Yuan Im gleichen Zeitraum des Vorjahres betrug der der Muttergesellschaft zuzurechnende Nettoverlust nach Abzug gemeinnütziger Organisationen 3,38 Milliarden Yuan, und der Nettogewinn betrug im gleichen Zeitraum des Vorjahres 146 Millionen Yuan.

Laut Jiemian News gab Wu Xiaoru, Präsident von iFlytek, bekannt, dass der gravierende Rückgang des Nettogewinns von iFlytek im Jahr 2022 und im ersten Quartal 2023 hauptsächlich auf die Investitionen des Unternehmens in den Ausbau von Kooperationsplattformen für nachhaltig operierende Unternehmen zurückzuführen ist wie Bildung und medizinische Versorgung sowie die Forschung und Entwicklung neuer Produkte sowie eine zusätzliche Investition von rund 800 Millionen Yuan in die Kerntechnologie, unabhängige Steuerbarkeit und Lokalisierungsanpassung.

Allerdings scheint sich iFlytek keine allzu großen Sorgen über den Leistungsabfall zu machen. Bei der Leistungsbesprechung wurde erklärt, dass man aufgrund der aktuellen Fortschritte bei der inländischen Substitution und der Geschäftsentwicklung ab dem zweiten Quartal dieses Jahres ein positives Umsatz- und Bruttogewinnwachstum erwarte und zuversichtlich sei, das Ziel zu erreichen hochwertiges Wachstum das ganze Jahr über.

Zu den Kerngeschäftsfeldern von iFlytek gehören Bildungsprodukte und -dienstleistungen, Informationstechnik und offene Plattformen. Unter ihnen sind Bildungsprodukte die Haupteinnahmequelle und machen 32,74 % des Gesamtumsatzes aus.

iFlytek hat außerdem ein Geschäftssystem für drei Arten von Kunden entwickelt: G-Seite, B-Seite und C-Seite: G-Seite ist hauptsächlich für Präfekturen, Städte, Landkreise und andere Regionen gedacht und deckt verschiedene Schulen und Benutzer in ab die Region mit Lösungen, um Schüler entsprechend ihrer Eignung zu unterrichten; auf der B-Seite geht es hauptsächlich um Big-Data-Präzisionsunterricht, Englisch-Hör- und Sprechunterricht, intelligente Hausaufgaben usw. für Schulen; auf der C-Seite geht es hauptsächlich um KI-Lernmaschinen für Eltern, personalisierte Lernhandbücher, außerschulische Kursangebote und andere Produkte.

Der Finanzbericht zeigt, dass das G-Side-Geschäft in mehr als 50 Städten und Bezirken (Bezirken) angewendet wurde; das iFlytek-Kundendienstgeschäft im B-Side-Geschäft hat mehr als 300 Bezirke und Bezirke abgedeckt und mehr als 12.000 Schulen; C Die Verkäufe von End-End-KI-Lernmaschinen stiegen in diesem Jahr um mehr als 50 %, das konkrete Verkaufsvolumen und die Menge wurden jedoch nicht bekannt gegeben.

Tatsächlich ist seine Leistung noch weit von der Zielleistung entfernt. Laut einer Ankündigung Anfang 2022 erwartet iFlytek, dass sein Geschäft in verschiedenen Regionen weiterhin um 50 % wächst. Gleichzeitig wurde erwähnt, dass der Umsatz des Geschäfts mit personalisierten Lernhandbüchern im Jahr 2022 voraussichtlich um mehr als 70 % wachsen wird, der Umsatz der KI-Lernmaschine soll um 200 %+ wachsen, und das Ziel ist es, im 14. Fünfjahresplan einen Jahresumsatz von 10 Milliarden Yuan zu erzielen.

Abgesehen davon, dass das Hauptgeschäft die Erwartungen nicht erfüllt, sind auch die Leistungen von iFlyteks Smart City, offenen Plattformen und Verbrauchergeschäften, Smart Cars, Smart Medical und anderen Geschäftsleistungen relativ durchschnittlich.

Der Finanzbericht zeigt, dass die drei Hauptsektoren Informationstechnik, digitale Anwendungen für die Regierungsindustrie sowie intelligente Anwendungen für die politische und juristische Industrie sowie das Geschäft mit offenen Plattformen im Rahmen von Smart City im Jahresvergleich alle einen Rückgang verzeichneten. Obwohl Smart Cars, Smart Medical Care und Smart Finance ein jährliches Wachstum von 19,33 % verzeichnen, ist ihr Anteil am Gesamtumsatz von Smart wirklich erbärmlich Auf Smart Cars und Smart Finance entfällt im Vergleich zum Vorjahr ein Wachstumstrend von 2,47 % bzw. 2,48 %.

Es scheint, dass das Hauptgeschäft von iFlytek nicht gut läuft und sein innovatives Geschäft noch lange nicht das Stadium großer Umsätze erreicht hat. iFlytek muss derzeit den enormen Wert von Großmodellen voll ausschöpfen, um die kommerzielle Wettbewerbsfähigkeit verschiedener Unternehmen zu verbessern.

Aber es wird einige Zeit dauern, um zu überprüfen, ob die großen Modelle, die derzeit an der Spitze stehen, iFlytek dabei helfen können, seine Ziele zu erreichen.

03 Große Model-Begeisterung, Ernüchterungszeit

Seit mehreren Monaten in diesem Jahr befinden sich Technologieunternehmen auf der ganzen Welt in einer fast verrückten Verfassung. Die Großmodelltechnik hat im In- und Ausland große Aufmerksamkeit und Anwendung gefunden. Insbesondere inländische Technologiegiganten haben eine Reihe eigener Großmodellprodukte auf den Markt gebracht.

Laut unvollständigen Statistiken von „Business Show“ gehören zu den Unternehmen, die groß angelegte Modellprodukte auf den Markt gebracht haben, Baidu Wenxiniyan, Alibaba Tongyi Qianwen, Huawei Pangu, SenseTime Ririxin, Kunlun Wanwei Tiangong und USTC iFlytek Spark sowie die Gründung großer Modellunternehmen Auch Internet-Tycoons wie Wang Huiwen und Wang Xiaochuan erhielten schnell eine Finanzierung.

Aber kann ein so großes Modell reibungslos laufen? Was ist der zentrale Wettbewerbswert großer Modelle? Welche anderen disruptiven Möglichkeiten können große Modelle mit sich bringen?

Die verrückte Welle großer Models hat auch das Stadium der Ernüchterung rationaler Prüfung erreicht.

„Viele große Modellprodukte entstehen derzeit, aber die Kosten für die Schulung und das Debuggen großer Modelle sind für die meisten Unternehmen nicht erschwinglich. Gleichzeitig ist die Selbstforschung für kleine und mittlere Unternehmen weniger wirtschaftlich.“ „In Zukunft wird es eher zu Konkurrenz zwischen den Giganten kommen“, sagte Dong Hao, Investmentmanager bei einem Risikokapitalinstitut, gegenüber „Business Show“.

NVIDIAs Untersuchungen zeigen, dass das größte GPT3-Modell 175 Milliarden Parameter erfordert und 7 Monate Training mit 512 V100-Grafikkarten oder bis zu einem Monat mit 1024 A100-Chips erfordert. Die monatlichen Schulungskosten für große Modelle liegen in der Größenordnung von Millionen Dollar.

Letzten Monat erwähnte Tian Qi, Chefwissenschaftler auf dem Gebiet der künstlichen Intelligenz von Huawei Cloud, auf dem von der China Artificial Intelligence Society veranstalteten Artificial Intelligence Large Model Technology Summit Forum in seiner Rede auch, dass die Einzelkosten für die Entwicklung großer Modelle und Die Ausbildung kostet bis zu 12 Millionen US-Dollar.

Die Entwicklungskosten großer Modelle sind sehr hoch, aber die Anwendungskosten (Gebühren) sind sehr niedrig. OpenAI hat im März dieses Jahres seine API (Application Programming Interface) eröffnet, die es Drittentwicklern ermöglicht, ChatGPT über die API in Anwendungen und Dienste zu integrieren. Der Schnittstellendienst kostet 0,002 US-Dollar pro 1.000 Token, was etwa 90 % günstiger ist als das GPT 3.5-Modell.

Wirtschaftliche Überlegungen zeigen, dass es schwierig ist, diese enormen Forschungs- und Entwicklungskosten wieder hereinzuholen, geschweige denn Rentabilität zu erzielen. Daher können sich kleine und mittlere Unternehmen dieses Geschäft nicht leisten, und nur große Unternehmen verfügen über genügend Mittel und Ressourcen, um zu investieren und um zukünftige Marktanteile zu konkurrieren.

Vielleicht haben Unternehmen, die große Modellprodukte auf den Markt gebracht haben, deshalb große Modellfunktionen in ihre bestehenden ausgereiften Produkte eingebaut. Dieser Ansatz kann die Fähigkeiten der künstlichen Intelligenz bestehender Produkte verbessern und mehr Kunden zum Kauf bestimmter Produkte bewegen, anstatt nur Schnittstellengebühren zu erheben. „Ein Brancheninsider sagte gegenüber „Business Show“.

Aber dennoch ist der Wettbewerb um inländische Großmodelle äußerst hart. Als Bürobereich mit relativ ausgereifter Anwendung großer Modelle haben viele Unternehmen verwandte Produkte auf den Markt gebracht. Beispielsweise kann DingTalk mit „Tongyi“ von Alibaba mehr als 10 Personen ansprechen Qianwen“ KI-Funktionen; Feishu, eine Office-Anwendung von ByteDance, wird auch den KI-Assistenten „MY AI“ starten; Kingsoft Office wird auch die „WPS AI“-Anwendung starten usw.

Dieses Mal stellte iFlytek auf der Spark-Modelleinführungskonferenz auch Büroprodukte wie Diktiergeräte, Übersetzer und Büronotizbücher vor, mit dem Ziel, mehr Benutzer in Büroszenarien zu gewinnen. Doch ob es wirklich gelingen kann, Gold zu schürfen, hängt von den tatsächlichen Rückmeldungen der Nutzer ab.

„Obwohl der Wettbewerb bei großen Modellen hauptsächlich zwischen Giganten stattfindet, ist es für Giganten schwierig, der Einzige zu sein. Der Schlüssel liegt in den Daten. Spieler sammeln unterschiedliche Daten in verschiedenen Bereichen, sodass sie ihre eigenen Kernvorteile in bestimmten Bereichen und Einzigartigkeit etablieren können.“ Szenen“, sagte Dong Hao weiter.

Alibaba verfügt beispielsweise über E-Commerce-Daten von Tmall und Taobao sowie Logistikdaten von Cainiao. Dies sind einzigartige Daten, die andere Unternehmen nicht erhalten können. Ebenso ist iFlytek seit vielen Jahren intensiv im Bildungsbereich tätig und hat diese ebenfalls gesammelt eigene einzigartige Daten. Diese Daten können der Schlüssel dazu sein, die Kluft zwischen Unternehmen wirklich zu vergrößern.

Mit anderen Worten, es kann für kleine und mittlere Unternehmen ohne kontinuierliche finanzielle Unterstützung schwierig sein, wirklich universelle Großmodellprodukte herzustellen. Die von großen Herstellern auf den Markt gebrachten Allzweck-Großmodellprodukte sind jedoch bereits daran interessiert, eine kommerzielle Umsetzung in Betracht zu ziehen und es mangelt ihnen an Geduld für Forschung und Entwicklung sowie für technologische Durchbrüche.

Dong Hao sagte unverblümt: „Das ging alles zu schnell. Innerhalb weniger Monate schienen alle großen Modelle ausgereift und bereit für den kommerziellen Einsatz zu sein, aber tatsächlich müssen viele Blasen darin sein

.“

Dieser fanatische Wettbewerb um große Modelle hat gerade erst begonnen. Während Giganten und Unternehmen ins Spiel kommen und sich wahnsinnig bekämpfen, rufen auch viele Menschen in der Branche: Es ist Zeit, zur ursprünglichen Absicht zurückzukehren und in Ehrfurcht vor der Technologie zu bleiben , und weiterhin das Geschäft erforschen, statt Nur durch blindes Streben nach Geschwindigkeit, Skalierung und Effizienz können wir die beste Ära großer Modelle einläuten.

(Die Gesprächspartner in diesem Artikel sind alle Pseudonyme)

Das obige ist der detaillierte Inhalt voniFlytek reagiert auf „Beschuss' und entzaubert den Hype um KI-Großmodelle. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)

1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

R.E.P.O. Beste grafische Einstellungen

1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Assassin's Creed Shadows: Seashell Riddle -Lösung

3 Wochen vor By DDD

Was ist neu in Windows 11 KB5054979 und wie Sie Update -Probleme beheben

2 Wochen vor By DDD

Will R.E.P.O. Crossplay haben?

1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Wo ist der Login-Zugang für Gmail-E-Mail?

7554

CakePHP-Tutorial

1382

Wie lautet das Format des Kontonamens von Steam?

Win11 -Aktivierungsschlüssel dauerhaft

NYT -Verbindungen Hinweise und Antworten

Related knowledge

Große KI-Modelle sind sehr teuer und nur große Unternehmen und Superreiche können sie erfolgreich einsetzen Apr 15, 2023 pm 07:34 PM

Der ChatGPT-Brand hat zu einer weiteren Welle der KI-Begeisterung geführt. Die Branche geht jedoch allgemein davon aus, dass sich nur große Unternehmen und superreiche Unternehmen KI leisten können, wenn die KI in die Ära großer KI-Modelle eintritt, da die Erstellung großer KI-Modelle sehr teuer ist . Das erste ist, dass es rechenintensiv ist. Avi Goldfarb, Marketingprofessor an der University of Toronto, sagte: „Wenn Sie ein Unternehmen gründen, selbst ein großes Sprachmodell entwickeln und es selbst berechnen möchten, sind die Kosten zu hoch. OpenAI ist sehr teuer und kostet Milliarden von Dollar.“ „Mietcomputer werden sicherlich viel billiger sein, aber Unternehmen müssen immer noch hohe Gebühren an AWS und andere Unternehmen zahlen. Zweitens sind Daten teuer. Trainingsmodelle erfordern riesige Datenmengen, manchmal sind die Daten leicht verfügbar und manchmal nicht. Daten wie CommonCrawl und LAION können kostenlos sein

Wie baut man ein KI-orientiertes Data-Governance-System auf? Apr 12, 2024 pm 02:31 PM

In den letzten Jahren sind mit dem Aufkommen neuer Technologiemodelle, der Wertsteigerung von Anwendungsszenarien in verschiedenen Branchen und der Verbesserung der Produkteffekte aufgrund der Ansammlung riesiger Datenmengen Anwendungen der künstlichen Intelligenz aus Bereichen wie Konsum und Internet ausgestrahlt worden zu traditionellen Branchen wie Fertigung, Energie und Elektrizität. Der Reifegrad der Technologie und Anwendung künstlicher Intelligenz in Unternehmen verschiedener Branchen in den Hauptbereichen wirtschaftlicher Produktionsaktivitäten wie Design, Beschaffung, Produktion, Management und Vertrieb verbessert sich ständig und beschleunigt die Implementierung und Abdeckung künstlicher Intelligenz in allen Bereichen schrittweise Integration in das Hauptgeschäft, um den Industriestatus zu verbessern oder die Betriebseffizienz zu optimieren und die eigenen Vorteile weiter auszubauen. Die groß angelegte Implementierung innovativer Anwendungen der Technologie der künstlichen Intelligenz hat die starke Entwicklung des Big-Data-Intelligence-Marktes vorangetrieben und auch den zugrunde liegenden Data-Governance-Diensten Marktvitalität verliehen. Mit Big Data, Cloud Computing und Computing

Populärwissenschaft: Was ist ein KI-Großmodell? Jun 29, 2023 am 08:37 AM

Unter KI-Großmodellen versteht man Modelle der künstlichen Intelligenz, die mithilfe umfangreicher Daten und leistungsstarker Rechenleistung trainiert werden. Diese Modelle weisen in der Regel ein hohes Maß an Genauigkeit und Generalisierungsfähigkeiten auf und können auf verschiedene Bereiche wie die Verarbeitung natürlicher Sprache, Bilderkennung, Spracherkennung usw. angewendet werden. Das Training großer KI-Modelle erfordert eine große Menge an Daten und Rechenressourcen, und in der Regel ist es erforderlich, ein verteiltes Computer-Framework zu verwenden, um den Trainingsprozess zu beschleunigen. Der Trainingsprozess dieser Modelle ist sehr komplex und erfordert eine eingehende Untersuchung und Optimierung der Datenverteilung, Merkmalsauswahl, Modellstruktur usw. KI-Großmodelle haben ein breites Anwendungsspektrum und können in verschiedenen Szenarien eingesetzt werden, z. B. im intelligenten Kundenservice, im Smart Home, beim autonomen Fahren usw. In diesen Anwendungen können große KI-Modelle Menschen dabei helfen, verschiedene Aufgaben schneller und genauer zu erledigen und die Arbeitseffizienz zu verbessern.

Im Zeitalter großer KI-Modelle fördern neue Datenspeicherbasen den Übergang zur digitalen Intelligenz in der Bildung und wissenschaftlichen Forschung Jul 21, 2023 pm 09:53 PM

Generative KI (AIGC) hat eine neue Ära der allgemeinen künstlichen Intelligenz eingeleitet. Der Wettbewerb um große Modelle ist zu einem spektakulären Schwerpunkt geworden, und das Erwachen der Macht ist zunehmend zu einem Branchenkonsens geworden. In der neuen Ära bewegen sich große Modelle von Einzelmodalität zu Multimodalität, die Größe von Parametern und Trainingsdatensätzen wächst exponentiell und riesige unstrukturierte Daten erfordern gleichzeitig die Unterstützung leistungsstarker Mischlastfunktionen; datenintensiv Das neue Paradigma erfreut sich immer größerer Beliebtheit und Anwendungsszenarien wie Supercomputing und High Performance Computing (HPC) rücken in die Tiefe. Bestehende Datenspeichergrundlagen sind nicht mehr in der Lage, den ständig wachsenden Anforderungen gerecht zu werden. Wenn Rechenleistung, Algorithmen und Daten die „Troika“ sind, die die Entwicklung künstlicher Intelligenz vorantreibt, dann müssen diese drei angesichts der enormen Veränderungen im äußeren Umfeld dringend wieder an Dynamik gewinnen

Vivo bringt ein selbst entwickeltes Allzweck-KI-Modell auf den Markt – das Blue Heart Model Nov 01, 2023 pm 02:37 PM

Vivo veröffentlichte am 1. November auf der Entwicklerkonferenz 2023 seine selbst entwickelte allgemeine Matrix für künstliche Intelligenz – das Blue Heart Model. Vivo kündigte an, dass das Blue Heart Model 5 Modelle mit unterschiedlichen Parameterebenen auf den Markt bringen wird : Milliarden, Dutzende Milliarden und Hunderte von Milliarden, die Kernszenarien abdecken, und ihre Modellfähigkeiten nehmen eine führende Position in der Branche ein. Vivo ist der Ansicht, dass ein gutes selbstentwickeltes großes Modell die folgenden fünf Anforderungen erfüllen muss: großer Maßstab, umfassende Funktionen, leistungsstarke Algorithmen, sicher und zuverlässig, unabhängige Entwicklung und sollte weitgehend Open Source sein. Der neu geschriebene Inhalt ist wie folgt: Unter ihnen Das erste ist das Blue-Heart-Modell Modell 7B, ein 7-Milliarden-Level-Modell, das duale Dienste für Mobiltelefone und die Cloud bereitstellen soll. Vivo sagte, dass dieses Modell in Bereichen wie Sprachverständnis und Texterstellung eingesetzt werden kann.

Wird das Lernen des Vergessens in Bezug auf das menschliche Gehirn große KI-Modelle besser machen? Mar 12, 2024 pm 02:43 PM

Kürzlich entwickelte ein Team von Informatikern ein flexibleres und belastbareres Modell für maschinelles Lernen mit der Fähigkeit, bekannte Informationen regelmäßig zu vergessen, eine Funktion, die in bestehenden groß angelegten Sprachmodellen nicht zu finden ist. Tatsächliche Messungen zeigen, dass die „Vergessensmethode“ in vielen Fällen beim Training sehr effizient ist und das Vergessensmodell eine bessere Leistung erbringt. Jea Kwon, ein KI-Ingenieur am Institute for Basic Science in Korea, sagte, die neue Forschung bedeute einen erheblichen Fortschritt auf dem Gebiet der KI. Die Trainingseffizienz der „Vergessensmethode“ ist sehr hoch. Die meisten gängigen KI-Sprach-Engines verwenden künstliche neuronale Netzwerktechnologie. Jedes „Neuron“ in dieser Netzwerkstruktur ist eigentlich eine mathematische Funktion. Sie sind miteinander verbunden, um Informationen zu empfangen und zu übertragen.

KI-Großmodelle sind beliebt! Technologiegiganten haben sich angeschlossen, und vielerorts haben die Richtlinien ihre Umsetzung beschleunigt. Jun 11, 2023 pm 03:09 PM

Künstliche Intelligenz ist in jüngster Zeit wieder in den Fokus menschlicher Innovationen gerückt und der Rüstungswettbewerb rund um KI ist intensiver denn je. Nicht nur aus Angst, den neuen Trend zu verpassen, versammeln sich Technologiegiganten, um sich dem Kampf der großen Modelle anzuschließen, sondern auch Peking, Shanghai, Shenzhen und andere Orte haben Richtlinien und Maßnahmen eingeführt, um Forschung zu Algorithmen und Schlüsselinnovationen für große Modelle durchzuführen Technologien, um ein Hochland für Innovationen im Bereich der künstlichen Intelligenz zu schaffen. Große KI-Modelle boomen, und große Technologiegiganten haben sich angeschlossen. Der kürzlich auf dem Zhongguancun-Forum 2023 veröffentlichte „China Artificial Intelligence Large Model Map Research Report“ zeigt, dass Chinas große KI-Modelle einen boomenden Entwicklungstrend aufweisen, und das gibt es auch viele Unternehmen der Branche. Robin Li, Gründer, Vorsitzender und CEO von Baidu, sagte unverblümt, dass wir an einem neuen Ausgangspunkt stehen

Vortragsreservierung | Fünf Experten diskutierten: Wie wirken sich große KI-Modelle auf die Forschung und Entwicklung neuer Medikamente aus? Jun 08, 2023 am 11:27 AM

1978 gründeten Stuart Marson und andere von der University of California das weltweit erste kommerzielle CADD-Unternehmen und leisteten Pionierarbeit bei der Entwicklung eines chemischen Reaktions- und Datenbankabrufsystems. Seitdem ist das computergestützte Arzneimitteldesign (Computer Aided Drug Design, CADD) in eine Ära rasanter Entwicklung eingetreten und hat sich für Pharmaunternehmen zu einem wichtigen Mittel für die Arzneimittelforschung und -entwicklung entwickelt, was zu revolutionären Verbesserungen in diesem Bereich geführt hat. Am 5. Oktober 1981 veröffentlichte das Fortune-Magazin einen Titelartikel mit dem Titel „Die nächste industrielle Revolution: Merck entwirft Medikamente durch Computer“, in dem offiziell die Einführung der CADD-Technologie angekündigt wurde. Im Jahr 1996 wurde der erste auf SBDD (Structur-Based Drug Design) basierende Carboanhydrase-Inhibitor erfolgreich auf den Markt gebracht und fand breite Anwendung in der Arzneimittelforschung und -entwicklung.

See all articles