Kürzlich verzeichnete ein Open-Source-Projekt namens „ChatGPT Plugins Domestic Alternative System“ einen starken Anstieg der Sterne auf GitHub.
Bei diesem Projekt handelt es sich um BMTools, eine große Modell-Tool-Lern-Engine, die von Wallface Intelligence entwickelt wurde.
Projektadresse: https://www.php.cn/link/a330f9fecc388ce67f87b09855480ca3
Zuerst das Meiste Wichtige Frage: Was ist das Tolle an BMTools?
Als skalierbare Open-Source-Tool-Lernplattform auf Basis von Sprachmodellen hat das Forschungs- und Entwicklungsteam von Wallface verschiedene Tool-Aufrufprozesse im BMTools-Framework vereinheitlicht und so den gesamten Tool-Aufrufprozess standardisiert und automatisiert.
Derzeit decken die von BMTools unterstützten Plug-ins Unterhaltung, Wissenschaft, Leben und andere Aspekte ab, einschließlich Douban-Film (Douban-Film), Suche (Bing-Suche), Klarna (Einkaufen) usw.
Entwickler können mit BMTools ein bestimmtes Modell (z. B. ChatGPT, GPT-4) verwenden, um verschiedene Toolschnittstellen aufzurufen, um bestimmte Funktionen zu implementieren.
Darüber hinaus hat das BMTools-Toolkit auch die kürzlich beliebten Auto-GPT und BabyAGI integriert.
Was bewirkt diese Art des Werkzeuglernens also bei großen Modellen?
Obwohl große Modelle in vielerlei Hinsicht bemerkenswerte Ergebnisse erzielt haben, weisen sie bei Aufgaben in bestimmten Bereichen immer noch gewisse Einschränkungen auf. Um diese Aufgaben effektiv lösen zu können, sind oft spezielle Tools oder Domänenkenntnisse erforderlich.
So wie Smartphones Apps herunterladen müssen, um ein besseres Benutzererlebnis zu haben, müssen große Modelle daher in der Lage sein, verschiedene professionelle Tools aufzurufen, um eine umfassendere Unterstützung für reale Aufgaben zu bieten.
Tool Learning, ein neues Paradigma großer Modelle entstand. Im Mittelpunkt dieses Paradigmas steht die Verschmelzung spezialisierter Tools mit den Stärken der zugrunde liegenden Modelle, um eine höhere Genauigkeit, Effizienz und Autonomie bei der Problemlösung zu erreichen.
Die organische Kombination großer Modelle und externer Tools hat viele Mängel früherer Funktionen erfolgreich ausgeglichen, und das Lernen von Werkzeugen hat das Potenzial großer Modelle erheblich freigesetzt.
Papieradresse: https://arxiv.org/abs/2304.08354
Am 23. März 2023 gab OpenAI die Einführung des Plug-in-Systems (Plugins) bekannt. . Kompetenz ist das, was wir instrumentelles Lernen nennen.
Mit der Unterstützung des Tool-Lernens können Plugins ChatGPT bei der Verbindung von Browsern, mathematischen Berechnungen und anderen externen Tools unterstützen und so seine Fähigkeiten erheblich erweitern.
Das Aufkommen der ChatGPT-Plugins hat die letzten Mängel von ChatGPT behoben und es ermöglicht, die Vernetzung zu unterstützen und mathematische Berechnungen zu lösen. Dies wird als „App Store“-Moment von OpenAI bezeichnet. Bisher wurde es jedoch nur für OpenAI Plus-Benutzer unterstützt und blieb für die meisten Entwickler nicht verfügbar.
Warum kann Mianbi BMTools nur zehn Tage nach der Veröffentlichung der ChatGPT-Plugins starten?
Facing Wall Intelligence konzentriert sich seit 2022 auf die Entwicklung effizienter Rechenwerkzeuge für den gesamten Prozess großer Modelle. Das Forschungs- und Entwicklungsteam forscht weiterhin an neuen Paradigmen des Werkzeuglernens und versucht, bestehende Sprachmodelle damit zu kombinieren Mit Suchmaschinen, Wissensdatenbanken und anderen Tools wurden gute experimentelle Ergebnisse erzielt. Das Team hat auch fruchtbare Untersuchungen im hochmodernen Forschungsgebiet des Werkzeuglernens durchgeführt.
Um die großen Erwartungen vieler Entwickler an die Fähigkeiten von OpenAI-Plugins zu erfüllen, hat das Team basierend auf der vorherigen Sammlung schnell die relevanten Forschungsergebnisse bearbeitet und sie im Toolkit BMTools zusammengefasst. Das Tool-Lernen ist in das wandorientierte intelligente Großmodell-Fähigkeitssystem eingebettet und tritt offiziell dem OpenBMB-Großmodell-Werkzeugsystem „Family Bucket“ bei.
Tool-Learning ist nach der effizienten Trainings-, Feinabstimmungs-, Inferenz- und Komprimierungssuite auch ein weiteres Meisterwerk von Wallface Intelligence.
BMTools-Toolkit: https://www.php.cn/link/a330f9fecc388ce67f87b09855480ca3
Kürzlich veröffentlichte Wall-Facing Intelligence zusammen mit Forschern der Tsinghua-Universität, des Nationalen Volkskongresses und von Tencent gemeinsam WebCPM, das erste Open-Source-Framework für Frage- und Antwortmodelle, das auf interaktiver Websuche im chinesischen Bereich basiert Diese Initiative hat die Lücke im Bereich der inländischen Großmodelle geschlossen. Und WebCPM ist die erfolgreiche Praxis von BMTools.
Derzeit wurden WebCPM-bezogene Arbeiten in die ACL 2023, die führende Konferenz zur Verarbeitung natürlicher Sprache, aufgenommen.
WebCPM-Papier-Link: https://arxiv.org/abs/2305.06849
WebCPM-Daten- und Code-Link: https://github.com/thunlp/WebCPM
Das kann Allerdings sind seit der Popularität von ChatGPT in China große Modelle verschiedener Fraktionen entstanden, aber die meisten Modelle sind nicht mit dem Internet verbunden.
Große Modelle, die nicht mit dem Internet verbunden sind, können nicht die neuesten Informationen abrufen, und der generierte Inhalt basiert auf alten Datensätzen, was gewisse Einschränkungen mit sich bringt.
Das Merkmal von WebCPM besteht darin, dass der Informationsabruf auf einer interaktiven Websuche basiert. Es kann mit Suchmaschinen wie Menschen interagieren, um Faktenwissen zu sammeln, das zur Beantwortung von Fragen und Generierung von Antworten erforderlich ist.
Mit anderen Worten: Durch die Unterstützung der Internetfunktion wurden die Echtzeitfähigkeit und Genauigkeit der Beantwortung von Fragen großer Modelle erheblich verbessert.
WebCPM-Modell-Framework
WebCPM-Benchmarks mit WebGPT, der Suchtechnologie der neuen Generation hinter Microsofts kürzlich eingeführtem New Bing.
Wie WebGPT überwindet WebCPMdie Mängel des traditionellen LFQA (Long-form Question Answering)-Paradigmas für offene Fragen und Antworten mit langem Text: Es basiert auf einer nicht interaktiven Abrufmethode, d. h. es wird nur die ursprüngliche Frage als verwendet eine Abfrageanweisung zum Abrufen von Informationen.
Unter dem WebCPM-Framework kann das Modell hochwertige Informationen wie Menschen durchsuchen, indem es in Echtzeit mit Suchmaschinen interagiert, um Websuchen durchzuführen.
Darüber hinaus zerlegt das Modell bei komplexen Problemen diese wie Menschen in mehrere Unterprobleme und stellt nacheinander Fragen.
Darüber hinaus verbessert das Modell durch das Identifizieren und Durchsuchen relevanter Informationen schrittweise sein Verständnis des ursprünglichen Problems und stellt kontinuierlich neue Fragen, um nach vielfältigeren Informationen zu suchen.
Interaktive WebCPM-Suchoberfläche#🎜 🎜#
In Zukunft wird wandorientierte Intelligenz die Anwendung und Transformation wissenschaftlicher Forschungsergebnisse weiter fördern und sich bemühen, die Implementierung großer WebCPM-Modelle in entsprechenden Bereichen voranzutreiben.
hohes Gebäude, das sich dem Aufbau eines inländischen Großmodellsystems verschrieben hatGesichtswand-Intelligenz hat immer danach gestrebt, die Führung zu übernehmen die ursprüngliche Innovation großer Modelle und setzt sich für den Aufbau der Infrastruktur für groß angelegte Modelle der Intelligence-Ära und die Schaffung eines inländischen Großmodellsystems ein, mit dem Ziel, schließlich „große Modelle in Tausende von Haushalten fliegen zu lassen“.
Die Ergebnisse wandbezogener Intelligenz sind für alle offensichtlich und wurden von der Branche anerkannt.
Li Dahai, Chief Technology Officer von Zhihu, kommentierte einmal die Wand-Geheimdienste: „Das Wand-Geheimdienstteam ist das erste Team in China.“ Das Unternehmen behält sich vor, umfassende technische Fähigkeiten für die Forschung und Anwendung großer Modelle, einschließlich Feinabstimmungstechnologie und Beschleunigungstechnologie, zu nutzen. Zhihu glaubt, dass Wall-Facing Intelligence zu einem zentralen Akteur werden kann Bauen Sie Chinas Großmodell-Infrastruktur auf und werden Sie ein führender Akteur in Chinas Großmodell-Industrie. Tragen Sie zu Ihrer Karriere bei.
Smart Panorama zur Wand 🎜 🎜# Basierend auf der Toolplattform und der großen Modellbibliothek startete das Unternehmen das
ModelForce-Großmodellsystem und das CPM-Großmodell auf Unternehmensebene. ModelForce, eine auf großen Modellen basierende KI-Produktivitätsplattform, verfügt über ein integriertes effizientes Computer-Toolsystem für den gesamten Prozess des Trainings, der Feinabstimmung, Komprimierung und Inferenz großer Modelle. Die Plattform basiert auf den allgemeinen Fähigkeiten großer Modelle mit wenigen Stichproben und Nullstichproben. Sie verwendet standardisierte Feinabstimmungsmethoden für große Modelle und erstellt Null-Code-Feinabstimmungen. Tuning-Clients, die die Komplexität im KI-Forschungs- und Entwicklungsprozess erheblich reduzieren können. Datenkennzeichnungskosten, Rechenleistungskosten und Arbeitskosten.
Die Unternehmensversion des CPM-Großmodells hat ihre Funktionen für das Open-Source-Versionsmodell aktualisiert und verfügt über die Merkmale der Integration mehrerer Funktionen, der inkrementellen Feinabstimmung und der flexiblen Anpassung. und Multi-Szenario-Anwendung.
Basierend auf dem CPM-Großmodell auf Unternehmensebene und dem ModelForce-Großmodellsystem arbeitete Wallface Intelligence mit Zhihu zusammen, um das
„Zhihaitu AI“-Großmodell zu trainieren # 🎜🎜#.Das große Modell „Zhihaitu AI“ wurde auf die Zhihu-Hotlist angewendet, mit der Elemente schnell extrahiert, Meinungen sortiert und Inhalte aggregiert werden können 23. April Veröffentlicht auf der HuDiscover-Konferenz.
Da hört es aber noch nicht auf. Tatsächlich steht Face Wall Intelligence hoch im Kurs und hat durch die Integration der akademischen Forschungsleistung von Spitzenuniversitäten und den weiteren Aufbau und Betrieb erfolgreich ein „Trinity“-Großmodell aus Industrie, Universität und Forschung geschaffen Die groß angelegte Modell-Open-Source-Community OpenBMB, Face Wall baut auf intelligente Weise einen geschlossenen Kanal zwischen Branchennachfrage, Open-Source-Algorithmen und industrieller Implementierung auf und ist bestrebt, Spitzenforschung, Anwendungsforschung und -entwicklung sowie industrielle Entwicklung im Bereich zu fördern inländische große Modelle.
OpenBMB Open Source Community#🎜 🎜 #
Es wurde in den 1970er Jahren gegründet und ist eine beispiellose Forschungseinheit in China, die NLP-Forschung betreibt Die Forschungsarbeit im Bereich der großen Modelle ist hervorragend. #? 🎜# Das CPM-Großmodell widmet sich der Anwendung und Implementierung großer Modelle in typischen Szenarien und Bereichen der künstlichen Intelligenz und ist ein vorab trainiertes Sprachgroßmodell, das vom Wallface-Team auf der Grundlage jahrelanger Erfahrung im Training großer Modelle selbst entwickelt wurde. Das Unternehmen hat derzeit Angel-Finanzierungsrunden im Wert von mehreren zehn Millionen Yuan abgeschlossen, und viele namhafte Institutionen haben eine strategische Zusammenarbeit mit dem Unternehmen geschlossen.
Das obige ist der detaillierte Inhalt vonDie inländische Open-Source-Version des „ChatGPT-Plug-in-Systems' ist da! Douban und Search sind alle verfügbar und werden gemeinsam von der Tsinghua University, Face Wall Intelligence usw. veröffentlicht.. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!