Die Menge an Textdaten, die für das Training von Google PaLM 2 verwendet wird, ist fast fünfmal so groß wie die der ursprünglichen Generation-KI-php.cn

Heim

Die Menge an Textdaten, die für das Training von Google PaLM 2 verwendet wird, ist fast fünfmal so groß wie die der ursprünglichen Generation

PHPz

May 21, 2023 pm 06:49 PM

谷歌 palm 2

谷歌 PaLM 2训练所用文本数据量是初代的近5倍

Neuigkeiten vom 17. Mai: Google hat letzte Woche auf der I/O-Entwicklerkonferenz 2023 sein neuestes groß angelegtes Sprachmodell PaLM 2 vorgestellt. Interne Unternehmensdokumente zeigen, dass die Menge an Textdaten, die für das Training neuer Modelle ab 2022 verwendet wird, fast fünfmal so hoch ist wie bei der Vorgängergeneration.

Es wird berichtet, dass Googles neu veröffentlichtes PaLM 2 komplexere Programmier-, Computer- und kreative Schreibaufgaben ausführen kann. Interne Dokumente ergaben, dass die Anzahl der zum Training von PaLM 2 verwendeten Token 3,6 Billionen beträgt.

Der sogenannte Token ist eine Zeichenfolge, die zum Trainieren des Modells verwendet wird. Jede Zeichenfolge wird normalerweise als Token bezeichnet. Dies ist ein wichtiger Teil des Trainings großer Sprachmodelle und lehrt sie, vorherzusagen, welches Wort in einer Sequenz als nächstes kommt.

Die vorherige Generation des großen Sprachmodells PaLM, das 2022 von Google veröffentlicht wurde, verwendete 780 Milliarden Token für das Training.

Während Google sein Können in der Technologie der künstlichen Intelligenz unter Beweis stellen und veranschaulichen wollte, wie diese in Suchmaschinen, E-Mail, Textverarbeitung und Tabellenkalkulationen eingebettet werden kann, zögerte das Unternehmen, die Größe der Trainingsdaten oder andere Details preiszugeben. Auch das von Microsoft unterstützte OpenAI hält Details seines neu veröffentlichten großen Sprachmodells GPT-4 geheim.

Beide Unternehmen gaben an, dass der Grund für die Nichtoffenlegung dieser Informationen der harte Wettbewerb in der Branche der künstlichen Intelligenz sei. Sowohl Google als auch OpenAI möchten Nutzer anlocken, die Chatbots statt herkömmlicher Suchmaschinen für die Informationssuche nutzen möchten.

Aber da sich der Wettbewerb im Bereich der künstlichen Intelligenz verschärft, fordert die Forschungsgemeinschaft mehr Transparenz.

Seit der Einführung von PaLM 2 hat Google erklärt, dass das neue Modell kleiner ist als das vorherige große Sprachmodell, was bedeutet, dass die Technologie des Unternehmens bei der Erledigung komplexerer Aufgaben effizienter werden kann. Parameter werden häufig verwendet, um die Komplexität eines Sprachmodells zu beschreiben. Internen Dokumenten zufolge wurde PaLM 2 mit 340 Milliarden Parametern trainiert, und das ursprüngliche PaLM wurde mit 540 Milliarden Parametern trainiert.

Google hatte keinen unmittelbaren Kommentar.

Google sagte in einem Blogbeitrag zu PaLM 2, dass das neue Modell eine „neue Technologie“ namens „rechenoptimale Skalierung“ verwendet, um PaLM 2 „effizienter und insgesamt besser zu machen, z. B. schnellere Inferenz, weniger Serviceparameter usw.“ geringere Servicekosten.“

Bei der Veröffentlichung von PaLM 2 gab Google bekannt, dass das neue Modell in 100 Sprachen trainiert wurde und eine Vielzahl von Aufgaben bewältigen kann. PaLM 2 wird in 25 Funktionen und Produkten verwendet, darunter Googles experimenteller Chatbot Bard. PaLM 2 verfügt je nach Parameterskala über vier verschiedene Versionen, die von klein bis groß reichen: Gecko, Otter, Bison und Einhorn.

Laut von Google veröffentlichten Informationen ist PaLM 2 leistungsstärker als jedes bestehende Modell. Facebook kündigte im Februar dieses Jahres die Einführung eines großen Sprachmodells namens LLaMA an, bei dem 1,4 Billionen Token für das Training verwendet wurden. OpenAI gab bei der Veröffentlichung von GPT-3 den entsprechenden Trainingsumfang bekannt. Damals gab das Unternehmen an, dass das Modell auf 300 Milliarden Token trainiert worden sei. Im März dieses Jahres veröffentlichte OpenAI ein neues Modell, GPT-4, und sagte, es habe in vielen professionellen Tests auf „menschlichem Niveau“ abgeschnitten.

Den neuesten Dokumenten zufolge wurde das vor zwei Jahren von Google eingeführte Sprachmodell auf 1,5 Billionen Token trainiert.

Da neue generative KI-Anwendungen in der Technologiebranche schnell zum Mainstream werden, wird die Kontroverse um die zugrunde liegende Technologie immer heftiger.

Im Februar dieses Jahres trat El Mahdi El Mhamdi, ein leitender Wissenschaftler in der Forschungsabteilung von Google, wegen mangelnder Transparenz des Unternehmens zurück. Am Dienstag sagte Sam Altman, CEO von OpenAI, bei einer Anhörung des Justizunterausschusses des US-Senats zu Datenschutz und Technologie aus und stimmte neuen Systemen zum Umgang mit künstlicher Intelligenz zu.

„Für eine sehr neue Technologie brauchen wir ein neues Framework“, sagte Altman. „Natürlich tragen Unternehmen wie unseres eine große Verantwortung für die Tools, die sie herausbringen.“

Das obige ist der detaillierte Inhalt vonDie Menge an Textdaten, die für das Training von Google PaLM 2 verwendet wird, ist fast fünfmal so groß wie die der ursprünglichen Generation. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website

Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

KI-Kleiderentferner

Video Face Swap

Tauschen Sie Gesichter in jedem Video mühelos mit unserem völlig kostenlosen KI-Gesichtstausch-Tool aus!

Heißer Artikel

Wie kann ich KB5055523 in Windows 11 nicht installieren?

3 Wochen vor By DDD

Wie kann ich KB5055518 in Windows 10 nicht installieren?

3 Wochen vor By DDD

<🎜>: Dead Rails - wie man Wölfe zähme

4 Wochen vor By DDD

<🎜>: Wachsen Sie einen Garten - Komplette Mutationsführer

2 Wochen vor By DDD

Kraftstufen für jeden Feind & Monster in R.E.P.O.

4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Heiße Themen

Java-Tutorial

1659

CakePHP-Tutorial

1416

Laravel-Tutorial

1310

PHP-Tutorial

1258

C#-Tutorial

1232

Related knowledge

Sesam Open Door Exchange Webseite Login Neueste Version Gateio Offizieller Website Eingang Mar 04, 2025 pm 11:48 PM

Eine detaillierte Einführung in den Anmeldungsbetrieb der Sesame Open Exchange -Webversion, einschließlich Anmeldeschritte und Kennwortwiederherstellungsprozess.

Sesame Open Door Exchange -Webseite Registrierung Link Gate Trading App Registrierung Website Neueste Feb 28, 2025 am 11:06 AM

In diesem Artikel wird der Registrierungsprozess der Webversion Sesam Open Exchange (GATE.IO) und die Gate Trading App im Detail vorgestellt. Unabhängig davon, ob es sich um eine Webregistrierung oder eine App -Registrierung handelt, müssen Sie die offizielle Website oder den offiziellen App Store besuchen, um die Genuine App herunterzuladen, und dann den Benutzernamen, das Kennwort, die E -Mail, die Mobiltelefonnummer und die anderen Informationen eingeben und eine E -Mail- oder Mobiltelefonüberprüfung abschließen.

Top 10 für Crypto Digital Asset Trading App (2025 Global Ranking) empfohlen Mar 18, 2025 pm 12:15 PM

Dieser Artikel empfiehlt die Top Ten Ten Cryptocurrency -Handelsplattformen, die es wert sind, auf Binance, OKX, Gate.io, Bitflyer, Kucoin, Bybit, Coinbase Pro, Kraken, BYDFI und Xbit -dezentrale Börsen geachtet zu werden. Diese Plattformen haben ihre eigenen Vorteile in Bezug auf Transaktionswährungsmenge, Transaktionstyp, Sicherheit, Konformität und Besonderheiten. Die Auswahl einer geeigneten Plattform erfordert eine umfassende Überlegung, die auf eigener Handelserfahrung, Risikotoleranz und Investitionspräferenzen basiert. Ich hoffe, dieser Artikel hilft Ihnen dabei, den besten Anzug für sich selbst zu finden

Tutorial zur Registrierung, Verwendung und Stornierung von Ouyi Okex -Konto Mar 31, 2025 pm 04:21 PM

In diesem Artikel wird ausführlich die Registrierungs-, Nutzungs- und Stornierungsverfahren von Ouyi Okex -Konto eingeführt. Um sich zu registrieren, müssen Sie die App herunterladen, Ihre Handynummer oder E-Mail-Adresse eingeben, um sich zu registrieren, und die authentifizierte Authentifizierung abschließen. Die Verwendung deckt die Betriebsschritte wie Anmeldung, Aufladung und Rückzug, Transaktion und Sicherheitseinstellungen ab. Um ein Konto zu kündigen, müssen Sie den Kundendienst von Ouyi Okex kontaktieren, die erforderlichen Informationen bereitstellen und auf die Bearbeitung warten und schließlich die Bestätigung des Konto -Stornierens erhalten. In diesem Artikel können Benutzer das vollständige Lebenszyklusmanagement von Ouyi Okex -Konto problemlos beherrschen und digitale Asset -Transaktionen sicher und bequem durchführen.

Sesame Open Door Trading Platform Download Mobile Version Gateio Trading Platform Download -Adresse Feb 28, 2025 am 10:51 AM

Es ist wichtig, einen formalen Kanal auszuwählen, um die App herunterzuladen und die Sicherheit Ihres Kontos zu gewährleisten.

Die neueste Download -Adresse des Bitgets im Jahr 2025: Schritte zum Erhalten der offiziellen App Feb 25, 2025 pm 02:54 PM

Dieser Leitfaden enthält detaillierte Download- und Installationsschritte für die offizielle Bitget Exchange -App, die für Android- und iOS -Systeme geeignet ist. Der Leitfaden integriert Informationen aus mehreren maßgeblichen Quellen, einschließlich der offiziellen Website, dem App Store und Google Play, und betont Überlegungen während des Downloads und des Kontoverwaltung. Benutzer können die App aus offiziellen Kanälen herunterladen, einschließlich App Store, offizieller Website APK Download und offizieller Website -Sprung sowie vollständige Registrierung, Identitätsüberprüfung und Sicherheitseinstellungen. Darüber hinaus deckt der Handbuch häufig gestellte Fragen und Überlegungen ab, wie z.

Registrieren Sie sich und laden Sie die neueste App auf der offiziellen Bitget -Website herunter und laden Sie sie herunter Mar 05, 2025 am 07:54 AM

Warum wird Bittensor als 'Bitcoin' in der KI -Strecke gesagt? Mar 04, 2025 pm 04:06 PM

Original -Titel: Bittensor = Aibitcoin? Bittensor nimmt ein Subnetzmodell an, das die Entstehung verschiedener KI -Lösungen ermöglicht und Innovation durch Tao -Token inspiriert. Obwohl der KI -Markt ausgereift ist, steht Bittensor mit wettbewerbsfähigen Risiken aus und kann anderen Open Source unterliegen

See all articles