


Die Entwicklung groß angelegter Modelle ist begrenzt und erfordert die Erstellung erklärbarer KI-Theorien
Die Einschränkung von GPT-4 besteht darin, dass es nur mit der digitalen Welt interagieren kann und wir letztendlich mit der physischen Welt interagieren müssen. Aus diesem Grund ist die Entstehung von Robotern besonders wichtig, da sie die Verwirklichung verkörperter Intelligenz darstellt. Zhang Bo wies darauf hin, dass es weder notwendig sei, humanoide Roboter zu entwickeln, noch übermäßig komplexe Hardware benötige. Er befürwortet die Durchführung von Reinforcement-Learning-Forschung auf Basis bestimmter Hardware. Ein solcher Ansatz ermöglicht eine Feinabstimmung, ohne die ursprüngliche Bedeutung zu verändern.
Die ganze Welt ist von den leistungsstarken Fähigkeiten und dem Potenzial großer Modelle überrascht, kann aber den Grund dafür nicht erklären und kann ihn nur auf das „Emergenz“-Phänomen zurückführen. Für eine gesunde Entwicklung der Branche der künstlichen Intelligenz müssen wissenschaftliche Forschung, technologische Innovation und industrielle Entwicklung integriert werden. Um die dritte Generation der künstlichen Intelligenz zu entwickeln, müssen erklärbare und belastbare Theorien und Methoden etabliert werden, sonst wird die KI-Technologie nie überzeugen.
Für große Sprachmodelle gibt es eine Obergrenze.
Obwohl der Weg zur allgemeinen künstlichen Intelligenz immer noch schwierig ist, haben große Sprachmodelle der KI-Branche einen breiten Weg eröffnet. Beim Zhipu AI 2024 Annual Technology Open Day sagte Akademiker Zhang Bo, dass große Modelle Möglichkeiten für die Entwicklung allgemeiner Hardware und Software bieten.
Das traditionelle KI-Paradigma verwendet spezifische Algorithmen und Regeln, um bestimmte Aufgaben zu erledigen. Das generative KI-Paradigma basiert auf einem allgemeinen Modell, das als Basismodell bezeichnet wird. Es kann in einer offenen Domäne (offene Domäne) durch Training an einem breiten Textbereich generiert werden Daten. Menschenähnliche, hochwertige Texte, Bilder und andere Inhalte, die durch Feinabstimmung und andere Methoden an eine Vielzahl nachgelagerter Aufgaben angepasst werden können. Generative KI geht einen Schritt in Richtung allgemeiner KI, der zweite Schritt sind KI-Agenten und der dritte Schritt ist verkörperte Intelligenz. Zhang Bo sagte, dass GPT-4 nur mit der digitalen Welt umgehen kann und wir uns letztendlich mit der physischen Welt befassen müssen, die Roboter, also verkörperte Intelligenz, erfordert. Der Vorschlag der verkörperten Intelligenz hilft beim Aufbau eines vollständigen intelligenten Agenten, der es dem intelligenten Agenten ermöglicht, sowohl wahrzunehmen als auch zu denken. „Man muss keinen humanoiden Roboter bauen, da man in vielen Fällen nur seine Hände oder Füße braucht und die Hardware nicht sehr kompliziert sein muss.“ Er befürwortet die Durchführung von Reinforcement-Learning-Forschung auf der Grundlage bestimmter Hardware.
Generative KI-Großmodelle haben drei Hauptfähigkeiten und einen großen Mangel. Das erste sind seine leistungsstarken Generierungsfunktionen, die Menschen mit ihrer Fähigkeit verblüffen, kohärenten Text mit einer Vielzahl von Kontexten und vergangenen Gesprächen zu erstellen. Zweitens verfügt es über starke Migrationsfähigkeiten, d. h. durch Schulung und Feinabstimmung der Agentenaufgaben kann es auf nachgelagerte Aufgaben von Interesse angewendet werden. Das dritte sind leistungsstarke Interaktionsfähigkeiten, einschließlich der Mensch-Computer-Interaktion, der Interaktion zwischen mehreren Agenten und der Interaktion mit der Umgebung, die es der KI ermöglichen, in verschiedenen Bereichen Intelligenzniveaus zu demonstrieren, die mit denen des Menschen vergleichbar sind. Allerdings haben diese großen Modelle auch einen Nachteil: Illusion. Manchmal generieren sie erfundene oder unsinnige Antworten, die vernünftig erscheinen.
Künstliche Intelligenz trägt zur Förderung des Wirtschaftswachstums bei. Branchen wie Bauwesen, Wartung und Installation lassen sich nur schwer automatisieren und intelligent machen, aber Bürojobs wie Verwaltungsmanagement könnten durch KI ersetzt werden. KI kann die Qualität und Effizienz der meisten menschlichen Arbeitsplätze verbessern, aber es gibt immer noch nur wenige Arbeitsplätze, die vollständig durch KI ersetzt werden. Der Grund dafür, dass KI die meisten Jobs noch nicht ersetzen kann, liegt darin, dass große Modelle immer noch eine unüberwindbare Grenze haben. Zhang Bo sagte, dass die gesamte Arbeit des großen Modells eher von externen als von proaktiven Eingabeaufforderungen abhängt und probabilistische Vorhersagen verwendet, um Aufgaben unter externen Eingabeaufforderungen zu erledigen, während die menschliche Arbeit von internen Absichten gesteuert wird. Die von großen Sprachmodellen erzeugte Sprache und die menschliche Sprachgenerierung ähneln sich nur im Verhalten, aber die internen Mechanismen unterscheiden sich grundlegend in Bezug auf Unwissenheit, unkontrollierbare Qualität, Unzuverlässigkeit und Unrobustheit wird unterschiedliche Antworten ausgeben. Auch große Models können Halluzinationen hervorrufen: „Egal wie groß das Model ist, der Mangel an Halluzinationen besteht immer.“
Er schlug vor, dass es zur Entwicklung der dritten Generation der künstlichen Intelligenz notwendig sei, erklärbare und robuste Theorien und Methoden der künstlichen Intelligenz zu etablieren, sichere, kontrollierbare, glaubwürdige, zuverlässige und skalierbare KI-Technologie zu entwickeln und innovative Anwendungen und Industrien des KI-Wechsels zu fördern . Wenn keine erklärbare und belastbare Theorie der künstlichen Intelligenz aufgestellt werden kann, wird die KI-Technologie unzuverlässig und niemals glaubwürdig sein. „Bisher wurde diese Theorie nicht etabliert, weshalb die Entwicklung der künstlichen Intelligenz langsam und mühsam verlief. Der Grund, warum die Theorie nicht etabliert werden konnte, liegt in drei spezifischen Einschränkungen. In der Vergangenheit konnten nur bestimmte Modelle verwendet werden.“ Um spezifische Aufgaben in bestimmten Bereichen zu lösen, wie ist es möglich, eine allgemeine Theorie zu etablieren? Die Entstehung großer Modelle bietet die Möglichkeit, diese Theorie zu etablieren
Zhang Bo sagte, dass große Modelle uns die Möglichkeit bieten, allgemeine Hardware und Software zu entwickeln. Künstliche Intelligenz tritt in eine Phase stetiger Entwicklung ein und hat enorme Auswirkungen auf alle Lebensbereiche. Wir müssen die Chance nutzen, die Branche der künstlichen Intelligenz weiterzuentwickeln. Doch es gibt immer noch viele Unsicherheiten, denn KI ist unvorhersehbar und unkontrollierbar. Die ganze Welt ist überrascht von den leistungsstarken Generierungs-, Migrations- und Interaktionsfähigkeiten großer Modelle, kann diese jedoch nicht erklären und kann sie nur der „Entstehung“ zuschreiben. Für eine gesunde Entwicklung der Branche der künstlichen Intelligenz müssen daher wissenschaftliche Forschung, technologische Innovation und industrielle Entwicklung kombiniert werden.Das obige ist der detaillierte Inhalt vonDie Entwicklung groß angelegter Modelle ist begrenzt und erfordert die Erstellung erklärbarer KI-Theorien. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Heiße KI -Werkzeuge

Undresser.AI Undress
KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover
Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool
Ausziehbilder kostenlos

Clothoff.io
KI-Kleiderentferner

Video Face Swap
Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Heiße Werkzeuge

Notepad++7.3.1
Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version
Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1
Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6
Visuelle Webentwicklungstools

SublimeText3 Mac-Version
Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen





Am 30. Mai kündigte Tencent ein umfassendes Upgrade seines Hunyuan-Modells an. Die auf dem Hunyuan-Modell basierende App „Tencent Yuanbao“ wurde offiziell eingeführt und kann in den App-Stores von Apple und Android heruntergeladen werden. Im Vergleich zur Hunyuan-Applet-Version in der vorherigen Testphase bietet Tencent Yuanbao Kernfunktionen wie KI-Suche, KI-Zusammenfassung und KI-Schreiben für Arbeitseffizienzszenarien. Yuanbaos Gameplay ist außerdem umfangreicher und bietet mehrere Funktionen für KI-Anwendungen , und neue Spielmethoden wie das Erstellen persönlicher Agenten werden hinzugefügt. „Tencent strebt nicht danach, der Erste zu sein, der große Modelle herstellt.“ Liu Yuhong, Vizepräsident von Tencent Cloud und Leiter des großen Modells von Tencent Hunyuan, sagte: „Im vergangenen Jahr haben wir die Fähigkeiten des großen Modells von Tencent Hunyuan weiter gefördert.“ . In die reichhaltige und umfangreiche polnische Technologie in Geschäftsszenarien eintauchen und gleichzeitig Einblicke in die tatsächlichen Bedürfnisse der Benutzer gewinnen

Tan Dai, Präsident von Volcano Engine, sagte, dass Unternehmen, die große Modelle gut implementieren wollen, vor drei zentralen Herausforderungen stehen: Modelleffekt, Inferenzkosten und Implementierungsschwierigkeiten: Sie müssen über eine gute Basisunterstützung für große Modelle verfügen, um komplexe Probleme zu lösen, und das müssen sie auch Dank der kostengünstigen Inferenzdienste können große Modelle weit verbreitet verwendet werden, und es werden mehr Tools, Plattformen und Anwendungen benötigt, um Unternehmen bei der Implementierung von Szenarien zu unterstützen. ——Tan Dai, Präsident von Huoshan Engine 01. Das große Sitzsackmodell feiert sein Debüt und wird häufig genutzt. Das Polieren des Modelleffekts ist die größte Herausforderung für die Implementierung von KI. Tan Dai wies darauf hin, dass ein gutes Modell nur durch ausgiebigen Gebrauch poliert werden kann. Derzeit verarbeitet das Doubao-Modell täglich 120 Milliarden Text-Tokens und generiert 30 Millionen Bilder. Um Unternehmen bei der Umsetzung groß angelegter Modellszenarien zu unterstützen, wird das von ByteDance unabhängig entwickelte Beanbao-Großmodell durch den Vulkan gestartet

„Hohe Komplexität, hohe Fragmentierung und Cross-Domain“ waren schon immer die Hauptprobleme auf dem Weg zur digitalen und intelligenten Modernisierung der Transportbranche. Kürzlich ist das „Qinling·Qinchuan Traffic Model“ mit einer Parameterskala von 100 Milliarden, das gemeinsam von China Science Vision, der Bezirksregierung Xi'an Yanta und dem Xi'an Future Artificial Intelligence Computing Center entwickelt wurde, auf den Bereich des intelligenten Transports ausgerichtet und bietet Dienstleistungen für Xi'an und die umliegenden Gebiete. Die Region wird ein Dreh- und Angelpunkt für intelligente Transportinnovationen sein. Das „Qinling·Qinchuan Traffic Model“ kombiniert Xi'ans umfangreiche lokale verkehrsökologische Daten in offenen Szenarien, den ursprünglich von China Science Vision unabhängig entwickelten fortschrittlichen Algorithmus und die leistungsstarke Rechenleistung der Shengteng AI des Xi'an Future Artificial Intelligence Computing Center Überwachung des Straßennetzes, intelligente Transportszenarien wie Notfallkommando, Wartungsmanagement und öffentlicher Verkehr führen zu digitalen und intelligenten Veränderungen. Das Verkehrsmanagement weist in verschiedenen Städten und auf verschiedenen Straßen unterschiedliche Merkmale auf

1. Produktpositionierung von TensorRT-LLM TensorRT-LLM ist eine von NVIDIA entwickelte skalierbare Inferenzlösung für große Sprachmodelle (LLM). Es erstellt, kompiliert und führt Berechnungsdiagramme auf der Grundlage des TensorRT-Deep-Learning-Kompilierungsframeworks aus und stützt sich auf die effiziente Kernels-Implementierung in FastTransformer. Darüber hinaus nutzt es NCCL für die Kommunikation zwischen Geräten. Entwickler können Betreiber entsprechend der Technologieentwicklung und Nachfrageunterschieden an spezifische Anforderungen anpassen, beispielsweise durch die Entwicklung maßgeschneiderter GEMM auf Basis von Entermessern. TensorRT-LLM ist die offizielle Inferenzlösung von NVIDIA, die sich der Bereitstellung hoher Leistung und der kontinuierlichen Verbesserung ihrer Praktikabilität verschrieben hat. TensorRT-LL

1. Einführung in den Hintergrund Lassen Sie uns zunächst die Entwicklungsgeschichte von Yunwen Technology vorstellen. Yunwen Technology Company ... 2023 ist die Zeit, in der große Modelle vorherrschen. Viele Unternehmen glauben, dass die Bedeutung von Diagrammen nach großen Modellen stark abgenommen hat und die zuvor untersuchten voreingestellten Informationssysteme nicht mehr wichtig sind. Mit der Förderung von RAG und der Verbreitung von Data Governance haben wir jedoch festgestellt, dass eine effizientere Datenverwaltung und qualitativ hochwertige Daten wichtige Voraussetzungen für die Verbesserung der Wirksamkeit privatisierter Großmodelle sind. Deshalb beginnen immer mehr Unternehmen, darauf zu achten zu wissenskonstruktionsbezogenen Inhalten. Dies fördert auch den Aufbau und die Verarbeitung von Wissen auf einer höheren Ebene, wo es viele Techniken und Methoden gibt, die erforscht werden können. Es ist ersichtlich, dass das Aufkommen einer neuen Technologie nicht alle alten Technologien besiegt, sondern auch neue und alte Technologien integrieren kann.

Laut Nachrichten vom 4. April hat die Cyberspace Administration of China kürzlich eine Liste registrierter großer Modelle veröffentlicht, in der das „Jiutian Natural Language Interaction Large Model“ von China Mobile enthalten ist, was darauf hinweist, dass das große Jiutian AI-Modell von China Mobile offiziell generative künstliche Intelligenz bereitstellen kann Geheimdienste nach außen. China Mobile gab an, dass dies das erste groß angelegte Modell sei, das von einem zentralen Unternehmen entwickelt wurde und sowohl die nationale Doppelregistrierung „Generative Artificial Intelligence Service Registration“ als auch die „Domestic Deep Synthetic Service Algorithm Registration“ bestanden habe. Berichten zufolge zeichnet sich Jiutians großes Modell für die Interaktion mit natürlicher Sprache durch verbesserte Branchenfähigkeiten, Sicherheit und Glaubwürdigkeit aus und unterstützt die vollständige Lokalisierung. Es hat mehrere Parameterversionen wie 9 Milliarden, 13,9 Milliarden, 57 Milliarden und 100 Milliarden gebildet. und kann flexibel in der Cloud eingesetzt werden, Edge und End sind unterschiedliche Situationen

Wenn die Testfragen zu einfach sind, können sowohl Spitzenschüler als auch schlechte Schüler 90 Punkte erreichen, und der Abstand kann nicht vergrößert werden ... Mit der Veröffentlichung stärkerer Modelle wie Claude3, Llama3 und später sogar GPT-5 ist die Branche in Bewegung Dringender Bedarf an einem schwierigeren und differenzierteren Benchmark-Modell. LMSYS, die Organisation hinter der großen Modellarena, brachte den Benchmark der nächsten Generation, Arena-Hard, auf den Markt, der große Aufmerksamkeit erregte. Es gibt auch die neueste Referenz zur Stärke der beiden fein abgestimmten Versionen der Llama3-Anweisungen. Im Vergleich zu MTBench, das zuvor ähnliche Ergebnisse erzielte, stieg die Arena-Hard-Diskriminierung von 22,6 % auf 87,4 %, was auf den ersten Blick stärker und schwächer ist. Arena-Hard basiert auf menschlichen Echtzeitdaten aus der Arena und seine Übereinstimmungsrate mit menschlichen Vorlieben liegt bei bis zu 89,1 %.

Achtung, dieser Mann hat mehr als 1.000 große Modelle angeschlossen, sodass Sie problemlos anschließen und wechseln können. Kürzlich wurde ein visueller KI-Workflow eingeführt: Er bietet Ihnen eine intuitive Drag-and-Drop-Oberfläche, mit der Sie Ihren eigenen Workflow per Drag-and-Drop auf einer unendlichen Leinwand anordnen können. Wie das Sprichwort sagt: Krieg kostet Geschwindigkeit, und Qubit hörte, dass Benutzer innerhalb von 48 Stunden nach der Online-Schaltung dieses AIWorkflows bereits persönliche Workflows mit mehr als 100 Knoten konfiguriert hatten. Ohne weitere Umschweife möchte ich heute über Dify, ein LLMOps-Unternehmen, und seinen CEO Zhang Luyu sprechen. Zhang Luyu ist auch der Gründer von Dify. Bevor er in das Unternehmen eintrat, verfügte er über 11 Jahre Erfahrung in der Internetbranche. Ich beschäftige mich mit Produktdesign, verstehe Projektmanagement und habe einige einzigartige Einblicke in SaaS. Später er
