Am 27. Mai veranstaltete Entrepreneurship Dark Horse den „2023 Leap•Dark Horse AIGC Summit“ in Peking. Das Thema dieser Konferenz lautet „Eine neue Welt vorhersehen und ein neues Muster aufbauen“. Justin Cassell, ehemaliger stellvertretender Dekan der School of Computer Science an der Carnegie Mellon University und bekannt als „KI-Experte“ und ehemaliger Vorsitzender des Computing Global Future Council des World Economic Forum (WEF) in Davos sowie der 360 Group, Zhiyuan Research Am Institut waren Führungskräfte zahlreicher Unternehmen der Branche, darunter Kunlun Wanwei, Yunzhisheng, BlueFocus, Wondershare Technology und Zhizhichuangyu, anwesend und führten einen intensiven Austausch mit Tausenden von Teilnehmern.
Auf dem Gipfel stellte Huang Wei, Gründer und CEO von Yunzhisheng, das Thema„Weg in eine intelligente Zukunft“ vor.
Das Folgende ist der Inhalt zum Teilen:
Am Anfang wollten wir es so machen, wie es Experten tun, in der Hoffnung, einige Methoden an die Maschine weiterzugeben. Vor zehn Jahren begann die Maschine, aus Fehlerrückmeldungen zu lernen. Dies sind die allgemeinen Stadien und Wege der Technologie der künstlichen Intelligenz in der Vergangenheit.Heute hat OpenAI ChatGPT und Pre-Training-Modelle eingeführt, und die gesamte Intelligenz ist anthropomorpher geworden. Zuerst haben wir alle bekannten Texte der Welt mit sehr hoher Rechenleistung gelesen und trainiert, um ein großes Modell zu bilden. Es ähnelt insbesondere dem Gehirn eines Babys, das Dutzende oder Hunderte von Milliarden Parametern haben kann. Im Gegensatz zum menschlichen Gehirn erbt das Baby höchstens das Aussehen und die Persönlichkeit seiner Eltern, aber das Gehirn des großen Modells erbt Wissen. Dies ist nur der Anfangszustand, und dann wird die Entwicklung des gesamten großen Modells durch verschiedene Methoden wie Feinabstimmung, wie Kinder, die während ihres Wachstums unterschiedliche Ausbildungen erhalten, anthropomorpher sein.
Dies ist eine Veränderung in der gesamten künstlichen Intelligenz.
Was sind die wesentlichen Veränderungen zwischen der heutigen AGI und früher? Vor Dezember 2022 wird die gesamte künstliche Intelligenz noch eine diskriminierende künstliche Intelligenz sein, die Beurteilungsfragen, spezielle Systeme und intelligente Module zur Ausführung bestimmter Aufgaben durchführt. Einerseits ist die Leistung künstlicher Intelligenz nicht so intelligent, und andere kritisieren oft: „Was Sie bereitstellen, ist künstliche Intelligenz“, sodass in der Vergangenheit die Obergrenze der Fähigkeiten künstlicher Intelligenz niedrig war.
Zweitens variieren die Kundenbedürfnisse in vielen Szenarien stark, aber die Fähigkeiten der künstlichen Intelligenz sind nicht so stark. Viele Unternehmen und Teams nutzen verschiedene Anpassungen, um sie zu erfüllen. Unternehmen mit künstlicher Intelligenz sind nicht wie High-Tech-Unternehmen. In den letzten zehn Jahren konnten sie diskriminierende KI nur in einer Ära manueller Werkstätten betreiben. Aber jetzt gibt es große Modelle und leistungsfähigere allgemeine Fähigkeiten, und die künstliche Intelligenz hat begonnen, in das Industriezeitalter einzutreten.
Mit neuen Generations- und Emergenzfähigkeiten kann ein Modell unterschiedliche Probleme in vielen Szenarien lösen. Heutzutage ist das große Modell der künstlichen Intelligenz ein Generator. Vor der Erfindung des Motors waren die Länder im Nahen Osten nicht so reich und der Wert des Öls war nicht so groß. Genau wie heute können Daten in Treibstoff und Fähigkeiten umgewandelt werden, und diese Fähigkeit kann genutzt werden, um Tausende von Branchen zu stärken.
Warum konnte Yunzhisheng in kurzer Zeit ein selbst entwickeltes Großmodell auf den Markt bringen?
Nachdem wir AlphaGo im Jahr 2016 gesehen hatten, führten wir medizinische Produkte in Krankenhäusern ein, um Ärzten im Peking Union Medical College Hospital zu helfen und ihre Arbeitseffizienz erheblich zu verbessern. Im Krankenhausszenario reichen Effizienztools allein nicht aus. Die eigentliche Intelligenz der künstlichen Intelligenz wurde 2017 vorgeschlagen. Kognitive Intelligenz erfordert eine relativ leistungsstarke Rechenleistung.
Mit diesen Grundlagen habe ich viel Erfahrung sowohl im akademischen als auch im ingenieurwissenschaftlichen Bereich gesammelt. Für den Einzelnen ist diese Erfahrung die Fähigkeit, seinen Lebensunterhalt zu verdienen, aber für ein Unternehmen ist es die zentrale Wettbewerbsfähigkeit, um auf dem Markt zu gewinnen. Nachdem wir uns das ChatGPT-Framework angesehen hatten, stellten wir fest, dass es sich bei allen um bestehende technische Kombinationen handelte. Wir haben diese Fähigkeit schnell kombiniert und in die Entwicklung großer Modelle investiert.
Wir haben vor drei Tagen ein großes kommerzielles Modell namens Shanhai veröffentlicht. Nachdem wir das Vortraining, die Feinabstimmung der Anweisungen und das verstärkende Lernen auf der Grundlage menschlichen Feedbacks durchlaufen hatten, sahen wir die lang erwarteten neuen Fähigkeiten. Damals dachte das Team darüber nach, ihm einen Namen zu geben. Ich war in dieser Zeit viel unterwegs und fand den Namen ziemlich gut. Das Meer ist majestätisch und seine Toleranz ist groß, was die unendliche generative Fähigkeit großer Modelle widerspiegelt. Berge sind hohe Berge, und wir wissen, was man sagen kann und was nicht, um sowohl die generative Fähigkeit großer Modelle als auch das Große hervorzuheben -Maßstabsmodelle. Modellieren Sie Sicherheits-Compliance-Probleme.
Es gibt ein sehr interessantes Phänomen. Alle reden über große Models. Der Fokus auf große Models begann nach dem Frühlingsfest, aber niemand redet darüber und sie sind sich nicht sicher. Bis heute herrscht die Meinung vor, dass dies nicht allein mit Technologie zu bewerkstelligen ist. Selbst wenn die entsprechenden Mitarbeiter vorhanden sind, ist der Schulungsaufwand sehr hoch und extrem teuer. Große Modelle sind keine wissenschaftliche Revolution oder die Erfindung neuer Algorithmen, sondern eine Kombination vorhandener Algorithmen, um sie zu vergrößern. Die meisten davon haben ihren Preis, und natürlich sind viele Projekte damit verbunden. Der Punkt ist richtig.
Wenn Sie andererseits glauben, dass großformatige Modelle in den nächsten 10 bis 20 Jahren eine große Chance sein werden und BAT nicht in sie investieren kann, also aufgeben, gibt es meiner Meinung nach immer noch eine Chance.
In den letzten Jahren brauchte Yunzhisheng keine besonders guten Wissenschaftler. Ich denke sogar, dass Wissenschaftler nicht so viel Rechenleistung verbraucht haben und nicht wissen, wo die Szene ist schlecht. Hersteller mit Szenarien haben die größten Erfolgsaussichten.
Der Name Shanhai hat auch eine andere Bedeutung. Derjenige, den du liebst, wird durch Berge und Meere getrennt, und Berge und Meere können dem Erdboden gleichgemacht werden.
Die Kraft der Berge und Meere ist der Zehnkampf. Die Generierungsfähigkeit ist sehr subjektiv, wenn die Szene implementiert wird. Warum ich in der Vergangenheit dachte, dass es sich um künstliche Intelligenz handelt, liegt an der fehlenden Verständnis- und Codierungsfähigkeit. Die Verbesserung der Codierungsfähigkeiten kann dazu beitragen, die Argumentationsfähigkeiten großer Modelle zu verbessern, und die Ausgabeergebnisse müssen den nationalen Gesetzen, Vorschriften und sogar moralischen Werten entsprechen. Wir nutzen auch die GPT-4-Plug-in-Architektur, um Unternehmen und Kunden mit One-Stop-Services von der Datenauswahl über Modellschulung bis hin zur Modellbereitstellung zu unterstützen.
Warum verfügen große Modelle über komplexe logische Denkfähigkeiten? Wir haben es heute gemacht, aber ich weiß nicht warum. Es ist schwer zu sagen, ob 50 Milliarden Parameter oder 100 Milliarden Parameter besser sind. Vielleicht sind die Neuronen in den 100 Milliarden Parametern noch nicht aktiviert.
Darüber hinaus gibt es noch die medizinische Versorgung. Viele Leute dachten, Yunzhisheng mache vertikale Industriemodelle. Wir haben eines der schwerwiegendsten Szenarien in Frage gestellt – die medizinische Versorgung. Während der Vorbereitungsphase haben wir eine Menge medizinischer Literatur, Monographien, Bücher und Krankenakten gesammelt und zig Millionen real beschrifteter Daten gesammelt, die konvertiert werden können in unsere Feinabstimmungsdaten.
Darüber hinaus haben wir 2019 den ersten Preis des Beijing Science and Technology Progress Award gewonnen. Das Gewinnerprojekt ist die Schlüsseltechnologie und Anwendung der Erstellung groß angelegter Wissensgraphen. Wir verfügen über einen der größten medizinischen Wissensgraphen in China. Wir zerlegen den Wissensgraphen in Wissens-Plug-Ins und betten sie in das große Sprachmodell ein, wodurch das große Modell zu einem Experten im medizinischen Bereich wird.
MedQA ist ein sehr maßgeblicher Testsatz für medizinisches Wissen, einschließlich Med-PaLM, ChatGPT und GPT-4, die alle ihre Bewertungsergebnisse für diesen Testsatz vor nicht allzu langer Zeit bekannt gegeben haben , was die 71 Punkte von GPT-4 deutlich übertrifft. Nach der Domänenerweiterung können große Modelle zu Experten auf einem bestimmten Gebiet gemacht werden. Es gibt eine weitere Zahl, die für den horizontalen Vergleich verwendet werden kann. Die höchste bekannte KI-Punktzahl für das Bestehen der klinischen Praktikerprüfung liegt bei 456 Punkten. Dies ist die Superfähigkeit, die große Modelle durch Domänenverbesserung erreichen. .
Es ist ziemlich schwierig, ein großes Modell zu bauen. Neben viel Geld und hervorragenden Algorithmen sind auch viele Fähigkeiten erforderlich. Intuitiv gesehen sind große Modelle selbst große Datensätze, und große Modelle sind die Aufgabe von Ingenieuren. Warum kann Yunzhisheng in wenigen Monaten sehr verlässliche und objektive Bewertungsdaten erstellen? In den allgemeinen Bereichen ist Yunzhisheng einer der Besten.
Bei der Rechenleistungsplattform geht es nicht nur darum, ein paar Karten zu kaufen und sie anzuschließen. Yunzhisheng verfügt über eine Rechenleistung von fast 200 P. Die Effizienz der Clusternutzung hat das höchste Niveau in der Branche erreicht. Sie kann unser Modell sehr schnell trainieren Karten.
Unsere aktuelle GPU-Cluster-Auslastung kann 50 % erreichen. Große Modelle erfordern mehrere Karten. Das aktuelle Branchenniveau liegt bei etwa 42 %. Große Modelle müssen außerdem ein 3D-Hybrid-Paralleltraining erreichen. Was ist 3D? Dies bedeutet die Parallelisierung des Modells, die Parallelisierung der Daten und die Parallelisierung der Pipeline. Die Aufgaben müssen zur Berechnung jeweils in verschiedene Karten vieler verschiedener Maschinen aufgeteilt werden, und schließlich können die Antwortergebnisse schnell erhalten werden. Darüber hinaus wurden viele Optimierungen bei der Modellbegründung vorgenommen und die Argumentationsgeschwindigkeit um das Fünffache erhöht. Wie trennt man die Trainingskarte und die Inferenzkarte? Die Trainingskarte ist A800 und die Inferenzkarte kann eine schnelle Argumentation erreichen eine einzelne Karte A6000.
Darüber hinaus sind Daten sehr wichtig, Datengröße, Datenvielfalt und hohe Datenqualität. Wir können jetzt eine schnelle Deduplizierung auf 10T-Ebene unterstützen. Die Trainingsanzahl von ChatGPT betrug 45T, aber nach der Optimierung wurden Hunderte von G Daten verwendet Ausbildung. .
Mit diesen Fähigkeiten können wir die Fähigkeiten von Atlas und UniDataOps nutzen, um die Industriekunden von Shanhai besser zu bedienen.
Intelligentes Internet der Dinge ist auch ein wichtiges Geschäftsfeld des Unternehmens. Die in der Vergangenheit verwendeten Ergebnisse waren tatsächlich nicht sehr gut. Wir hoffen, dass wir nach der Gründung von Shanhai große Modelle verwenden können Dinge-Produkte.
Medizinische Versorgung ist die Richtung, in die wir optimistisch sind. In der Vergangenheit hatte das Produkt im medizinischen Bereich hauptsächlich zwei Aspekte: Erstens kann man, anstatt mit den Händen auf der Tastatur zu tippen, direkt mit dem Mikrofon sprechen, was die Arbeitseffizienz des Arztes erheblich verbesserte und die Eingabezeit verkürzte Krankenakten von 3 Stunden bis 1 Sekunde. Nachdem wir die Krankenakten erhalten haben, gibt es auch ein System, um die Krankenakten durch das KI-Gehirn zu überprüfen, um zu überprüfen, ob es irgendwelche Fehler gibt Modellfähigkeit, was können wir tun?
Shanhais Vision ist es, durch künstliche Intelligenz eine vernetzte und intuitive Welt zu schaffen. Früher bestand die Definition von künstlicher Intelligenz darin, Maschinen dazu zu bringen, Menschen zu gehorchen. Die Kommunikation zwischen Menschen und Dingen wird intuitiver und neue Möglichkeiten werden neue Produkte und neue Geschäftsmodelle mit sich bringen. Ich bin sehr bereit, die neue Ära der großen Modelle mit allen hier zu begrüßen.
Scannen Sie den QR-Code, um der Dark Horse Entrepreneurs Exchange Group beizutreten
↓↓↓
Scannen Sie den QR-Code unten
Nehmen Sie am Dark Horse AIGC Industry Camp teil
Verstehen Sie die zugrunde liegende Logik von AIGC und stellen Sie in einem Schritt eine Verbindung zur Zukunft der Branche her
↓↓↓
Teilen, liken und ansehen, um die Drei-Klick-Kombination zu vervollständigen und guten Inhalt an mehr Menschen zu liefern, die ihn brauchen.
Weitere spannende Inhalte, alles in meinem Dark Horse-Videokonto
↓↓↓
Folgen Sie Dark Horse Communication Matrix und erhalten Sie weitere spannende Inhalte
↓↓ ↓
Das obige ist der detaillierte Inhalt vonLassen Sie die Maschine anthropomorphisieren, von „künstlicher geistiger Behinderung' zu „künstliche Intelligenz'. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!