Heim Technologie-Peripheriegeräte KI Google Gemini 1.5 wird schnell veröffentlicht: MoE-Architektur, 1 Million Kontexte

Google Gemini 1.5 wird schnell veröffentlicht: MoE-Architektur, 1 Million Kontexte

Feb 16, 2024 pm 06:50 PM
谷歌 产业 gemini

Heute hat Google die Einführung von Gemini 1.5 angekündigt.

Gemini 1.5 wurde auf der Grundlage der Forschung und technischen Innovationen von Google bei grundlegenden Modellen und Infrastruktur entwickelt. Diese Version führt eine neue Mix of Experts (MoE)-Architektur ein, um die Effizienz der Schulung und Bereitstellung von Gemini 1.5 zu verbessern.

Was Google herausgebracht hat, ist die erste Version von Gemini 1.5 für frühe Tests, nämlich Gemini 1.5 Pro. Es handelt sich um ein mittelgroßes multimodales Modell, das für eine Vielzahl von Aufgaben skaliert und optimiert ist. Im Vergleich zu Googles größtem Modell, 1.0 Ultra, bietet Gemini 1.5 Pro ein ähnliches Leistungsniveau und führt bahnbrechende experimentelle Funktionen ein, um lange Kontexte besser zu verstehen.

Die Anzahl der Token-Kontextfenster für Gemini 1.5 Pro beträgt 128.000. Allerdings bietet Google ab heute einer begrenzten Anzahl von Entwicklern und Unternehmenskunden eine private Vorschau von AI Studio und Vertex AI an, die es ihnen ermöglicht, es in einem kontextbezogenen Fenster mit bis zu 1.000.000 Token auszuprobieren. Darüber hinaus hat Google mehrere Optimierungen vorgenommen, die darauf abzielen, die Latenz zu verbessern, den Rechenaufwand zu reduzieren und das Benutzererlebnis zu verbessern.

Google CEO Sundar Pichai und Google DeepMind CEO Demis Hassabis gaben eine besondere Einführung in das neue Modell.

的 Die Kontextlänge des führenden Basismodells
Google Gemini 1.5 wird schnell veröffentlicht: MoE-Architektur, 1 Million Kontexte
Hocheffiziente Architektur

Gemini 1.5 basiert auf Googles führender Forschung zur Transformer- und MOE-Architektur. Der traditionelle Transformer fungiert als ein großes neuronales Netzwerk, während das MoE-Modell in kleinere „Experten“-Neuronale Netzwerke unterteilt ist.

Abhängig von der Art der gegebenen Eingabe lernt das MoE-Modell, selektiv nur die relevantesten Expertenpfade in seinem neuronalen Netzwerk zu aktivieren. Diese Spezialisierung erhöht die Effizienz des Modells erheblich. Google war ein früher Anwender und Pionier der Deep-Learning-MoE-Technologie durch Forschung zu Sparse-Gated-MoE, GShard-Transformer, Switch-Transformer, M4 und mehr.

Die neuesten Innovationen von Google in der Modellarchitektur ermöglichen es Gemini 1.5, komplexe Aufgaben schneller zu erlernen und die Qualität aufrechtzuerhalten, während gleichzeitig effizienter trainiert und bedient wird. Diese Effizienzsteigerungen helfen Google-Teams, schneller als je zuvor zu iterieren, zu trainieren und fortgeschrittenere Versionen von Gemini bereitzustellen, und arbeiten an weiteren Optimierungen.

Längerer Kontext, mehr nützliche Funktionen

Das „Kontextfenster“ des Modells der künstlichen Intelligenz besteht aus Token, die die Bausteine ​​für die Verarbeitung von Informationen sind. Ein Token kann ein ganzer oder untergeordneter Teil von Text, Bild, Video, Audio oder Code sein. Je größer das Kontextfenster des Modells ist, desto mehr Informationen kann es in einer bestimmten Eingabeaufforderung empfangen und verarbeiten, wodurch seine Ausgabe konsistenter, relevanter und nützlicher wird.

Durch eine Reihe von Innovationen im Bereich maschinelles Lernen hat Google die Kontextfensterkapazität von 1.5 Pro deutlich über die anfänglichen 32.000 Token von Gemini 1.0 hinaus erhöht. Das große Modell kann jetzt mit bis zu 1 Million Token in Produktion gehen.

Das bedeutet, dass der 1.5 Pro viele Informationen auf einmal verarbeiten kann, darunter 1 Stunde Video, 11 Stunden Audio, über 30.000 Codezeilen oder eine Codebasis von über 700.000 Wörtern. Bei Googles Recherchen wurden zudem bis zu 10 Millionen Token erfolgreich getestet.

Komplexe Argumentation bei großen Informationsmengen

1.5 Pro kann große Mengen an Inhalten innerhalb einer bestimmten Eingabeaufforderung nahtlos analysieren, klassifizieren und zusammenfassen. Wenn man beispielsweise ein 402-seitiges Transkript der Mondlandemission Apollo 11 erhält, könnte man über Dialoge, Ereignisse und Details im gesamten Dokument nachdenken.

                                                                                                                                                                                                     Gemini 1.5 Pro, um die merkwürdigen Details in den 402 Seiten mit Aufzeichnungen der Mondlandemission Apollo 11 zu verstehen, darüber nachzudenken und sie zu identifizieren.
Google Gemini 1.5 wird schnell veröffentlicht: MoE-Architektur, 1 Million Kontexte
Besseres Verständnis und Argumentation über verschiedene Modalitäten hinweg

1.5 Pro kann hochkomplexe Verständnis- und Argumentationsaufgaben für verschiedene Modalitäten, einschließlich Video, durchführen. Wenn das Modell beispielsweise einen 44-minütigen Stummfilm von Buster Keaton erhielt, konnte es verschiedene Handlungspunkte und Ereignisse genau analysieren und sogar über kleine Details im Film nachdenken, die leicht übersehen wurden.
Gemini 1.5 Pro kann die 402-seitige Aufzeichnung der Mondlandemission Apollo 11 verstehen, darüber nachdenken und merkwürdige Details identifizieren.
Besseres Verständnis und Argumentation über verschiedene Modalitäten hinweg

1.5 Pro kann hochkomplexe Verständnis- und Argumentationsaufgaben für verschiedene Modalitäten, einschließlich Video, durchführen. Wenn das Modell beispielsweise einen 44-minütigen Stummfilm von Buster Keaton erhielt, konnte es verschiedene Handlungspunkte und Ereignisse genau analysieren und sogar über kleine Details im Film nachdenken, die leicht übersehen wurden.
Gemini 1.5 Pro kann die 402-seitigen Aufzeichnungen der Mondlandemission Apollo 11 verstehen, darüber nachdenken und merkwürdige Details identifizieren.
Besseres Verständnis und Argumentation über verschiedene Modalitäten hinweg

1.5 Pro kann hochkomplexe Verständnis- und Argumentationsaufgaben für verschiedene Modalitäten, einschließlich Video, durchführen. Wenn das Modell beispielsweise einen 44-minütigen Stummfilm von Buster Keaton erhielt, konnte es verschiedene Handlungspunkte und Ereignisse genau analysieren und sogar über kleine Details im Film nachdenken, die leicht übersehen wurden.
Anhand einfacher Strichzeichnungen als Referenzmaterial für reale Objekte konnte Gemini 1.5 Pro 44 Minuten Szenen aus einem Stummfilm von Buster Keaton identifizieren.

Verwenden Sie längere Codeblöcke, um verwandte Probleme zu lösen.

1.5 Pro kann relevantere Problemlösungsaufgaben über längere Codeblöcke hinweg ausführen. Wenn Hinweise zu mehr als 100.000 Codezeilen gegeben werden, kann es anhand von Beispielen besser argumentieren, nützliche Änderungen vorschlagen und erklären, wie verschiedene Teile des Codes funktionieren. . Gemini 1.5 Pro kann 100.000 Codezeilen verarbeiten und bietet nützliche Lösungen, Änderungen und Anmerkungen. Google Gemini 1.5 wird schnell veröffentlicht: MoE-Architektur, 1 Million Kontexte
Verbesserte Leistung. Umfassendes Bedienfeld für Text, Code, Bild, Audio und Videoauswertung. Beim Testen Auf Windows Phone übertraf 1.5 Pro 1.0 Pro bei 87 % der Benchmarks, die zur Entwicklung großer Sprachmodelle (LLMs) verwendet wurden. Im Vergleich zum 1.0 Ultra in den gleichen Benchmarks schneidet es ungefähr ähnlich ab.
Auch wenn das Kontextfenster größer wird, behält Gemini 1.5 Pro ein hohes Leistungsniveau bei.

Bei der NIAH-Bewertung wurde ein kleiner Textabschnitt, der eine bestimmte Tatsache oder Aussage enthielt, absichtlich in einen sehr langen Textblock eingefügt. 1.5 Pro fand den eingebetteten Text in 99 % der Fälle im Datenblock wie folgt: nur 100 Zehntausend Token.

Gemini 1.5 Pro demonstriert außerdem beeindruckende Fähigkeiten zum „Lernen im Kontext“, was bedeutet, dass es neue Fähigkeiten aus Informationen erlernen kann, die in langen Eingabeaufforderungen gegeben werden, ohne dass zusätzliche Feinabstimmungen erforderlich sind. Google hat diese Fähigkeit im MTOB-Benchmark (Translation from One Book) getestet, der die Fähigkeit des Modells zeigt, aus nie zuvor gesehenen Informationen zu lernen. Wenn man ihm ein Grammatikhandbuch für Kalamang gibt, eine Sprache mit weniger als 200 Sprechern weltweit, kann das Modell lernen, Englisch ins Kalamang zu übersetzen, und zwar auf einem ähnlichen Niveau wie ein Mensch, der den gleichen Inhalt lernt.

Da das lange Kontextfenster von 1.5 Pro ein Novum für ein großes Modell ist, entwickelt Google ständig neue Auswertungen und Benchmarks, um seine neuartigen Funktionen zu testen.

Weitere Einzelheiten finden Sie im technischen Bericht zum Gemini 1.5 Pro.

Adresse des technischen Berichts: https://storage.googleapis.com/deepmind-media/gemini/gemini_v1_5_report.pdf

Erstellen und experimentieren Sie mit Gemini-Modellen

Google engagiert sich dafür Bringen Sie jede neue Generation von Gemini-Modellen verantwortungsbewusst Milliarden von Menschen, Entwicklern und Unternehmensbenutzern auf der ganzen Welt näher.
Ab heute stellt Google Entwicklern und Unternehmenskunden die Vorschau von 1.5 Pro über AI Studio und Vertex AI zur Verfügung.

Wenn das Modell in Zukunft auf breiter Basis veröffentlicht wird, wird Google 1.5 Pro mit einem standardmäßigen 128.000-Token-Kontextfenster starten. Google plant bald die Einführung von Preisstufen, beginnend mit den standardmäßigen 128.000 Kontextfenstern und einer Skalierung auf bis zu 1 Million Token, wenn das Modell verbessert wird.

Frühe Tester können während des Tests 1 Million Token-Kontextfenster kostenlos ausprobieren, und erhebliche Geschwindigkeitsverbesserungen sind in Kürze verfügbar.

Entwickler, die 1.5 Pro testen möchten, können sich jetzt in AI Studio registrieren, während Unternehmenskunden ihr Vertex AI-Kontoteam kontaktieren können.

Referenzlink: https://blog.google/technology/ai/google-gemini-next-generation-model-february-2024/#sundar-note

Das obige ist der detaillierte Inhalt vonGoogle Gemini 1.5 wird schnell veröffentlicht: MoE-Architektur, 1 Million Kontexte. Für weitere Informationen folgen Sie bitte anderen verwandten Artikeln auf der PHP chinesischen Website!

Erklärung dieser Website
Der Inhalt dieses Artikels wird freiwillig von Internetnutzern beigesteuert und das Urheberrecht liegt beim ursprünglichen Autor. Diese Website übernimmt keine entsprechende rechtliche Verantwortung. Wenn Sie Inhalte finden, bei denen der Verdacht eines Plagiats oder einer Rechtsverletzung besteht, wenden Sie sich bitte an admin@php.cn

Heiße KI -Werkzeuge

Undresser.AI Undress

Undresser.AI Undress

KI-gestützte App zum Erstellen realistischer Aktfotos

AI Clothes Remover

AI Clothes Remover

Online-KI-Tool zum Entfernen von Kleidung aus Fotos.

Undress AI Tool

Undress AI Tool

Ausziehbilder kostenlos

Clothoff.io

Clothoff.io

KI-Kleiderentferner

AI Hentai Generator

AI Hentai Generator

Erstellen Sie kostenlos Ai Hentai.

Heißer Artikel

R.E.P.O. Energiekristalle erklärten und was sie tun (gelber Kristall)
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. Beste grafische Einstellungen
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O. So reparieren Sie Audio, wenn Sie niemanden hören können
4 Wochen vor By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25: Wie man alles in Myrise freischaltet
1 Monate vor By 尊渡假赌尊渡假赌尊渡假赌

Heiße Werkzeuge

Notepad++7.3.1

Notepad++7.3.1

Einfach zu bedienender und kostenloser Code-Editor

SublimeText3 chinesische Version

SublimeText3 chinesische Version

Chinesische Version, sehr einfach zu bedienen

Senden Sie Studio 13.0.1

Senden Sie Studio 13.0.1

Leistungsstarke integrierte PHP-Entwicklungsumgebung

Dreamweaver CS6

Dreamweaver CS6

Visuelle Webentwicklungstools

SublimeText3 Mac-Version

SublimeText3 Mac-Version

Codebearbeitungssoftware auf Gottesniveau (SublimeText3)

Welche 2025 Währungsaustauschplattform ist besser? Die neuesten Empfehlungen der zehn beliebten Währungshandel -Apps Welche 2025 Währungsaustauschplattform ist besser? Die neuesten Empfehlungen der zehn beliebten Währungshandel -Apps Mar 25, 2025 pm 06:18 PM

2025 Rangliste der Währungsaustauschplattform: 1. OKX, 2. Binance, 3. Gate.io, 4. Coinbase, 5. Kraken, 6. Huobi Global, 7. Crypto.com, 8. Kucoin, 9. Gemini, 10. Bitstamp. Diese Plattformen arbeiten hervorragend bei Sicherheitsmaßnahmen, Benutzerbewertungen und Marktleistung und sind für Benutzer geeignet, um digitale Währungstransaktionen durchzuführen.

Zusammenfassung der sicheren und benutzerfreundlichen Handelsplattformen für virtuelle Währung im Jahr 2025 Zusammenfassung der sicheren und benutzerfreundlichen Handelsplattformen für virtuelle Währung im Jahr 2025 Mar 25, 2025 pm 06:15 PM

Empfohlene sichere und benutzerfreundliche Handelsplattformen für virtuelle Währung im Jahr 2025. Dieser Artikel fasst zehn globale Handelsplattformen für virtuelle Währung von Mainstream zusammen, darunter Binance, OKX, Huobi, Gate.io, Coinbase, Kraken, Kucoin, Bitfinex, Crypto.com und Gemini. Sie haben Vorteile in Bezug auf Handelspaare, 24-Stunden-Transaktionsvolumen, Sicherheit, Benutzererfahrung usw. Zum Beispiel ist Binance Trading schnell, OKX Futures Trading ist beliebt, Coinbase ist für Anfänger geeignet und Kraken ist bekannt für seine Sicherheit. Es ist jedoch zu beachten, dass virtuelle Währungstransaktionen äußerst riskant sind und Investitionen vorsichtig sein sollten. Bitte bewerten Sie Ihren eigenen Stil sorgfältig, bevor Sie eine Plattform auswählen

Tutorial zur Registrierung, Verwendung und Stornierung von Ouyi Okex -Konto Tutorial zur Registrierung, Verwendung und Stornierung von Ouyi Okex -Konto Mar 31, 2025 pm 04:21 PM

In diesem Artikel wird ausführlich die Registrierungs-, Nutzungs- und Stornierungsverfahren von Ouyi Okex -Konto eingeführt. Um sich zu registrieren, müssen Sie die App herunterladen, Ihre Handynummer oder E-Mail-Adresse eingeben, um sich zu registrieren, und die authentifizierte Authentifizierung abschließen. Die Verwendung deckt die Betriebsschritte wie Anmeldung, Aufladung und Rückzug, Transaktion und Sicherheitseinstellungen ab. Um ein Konto zu kündigen, müssen Sie den Kundendienst von Ouyi Okex kontaktieren, die erforderlichen Informationen bereitstellen und auf die Bearbeitung warten und schließlich die Bestätigung des Konto -Stornierens erhalten. In diesem Artikel können Benutzer das vollständige Lebenszyklusmanagement von Ouyi Okex -Konto problemlos beherrschen und digitale Asset -Transaktionen sicher und bequem durchführen.

Welche digitale Währungsaustausch -App ist im Jahr 2025 besser? Ranking von Top Ten Virtual Currency App -Austausch Welche digitale Währungsaustausch -App ist im Jahr 2025 besser? Ranking von Top Ten Virtual Currency App -Austausch Mar 25, 2025 pm 06:06 PM

Ranking des Austauschs der Secure Digital Currency App in 2025: 1. OKX, 2. Binance, 3. Gate.io, 4. Coinbase, 5. Kraken, 6. Huobi Global, 7. Crypto.com, 8. Kucoin, 9. Gemini, 10. Bitstamp. Diese Plattformen arbeiten hervorragend bei Sicherheitsmaßnahmen, Benutzerbewertungen und Marktleistung und sind für Benutzer geeignet, um digitale Währungstransaktionen durchzuführen.

Die jüngste Rangliste der Top Ten Cryptocurrency -Austausch der Welt im Jahr 2025 Die jüngste Rangliste der Top Ten Cryptocurrency -Austausch der Welt im Jahr 2025 Mar 26, 2025 pm 05:09 PM

Es ist schwierig, das Ranking des Kryptowährungsbörsen im Jahr 2025 vorherzusagen, da sich der Markt schnell verändert. Wichtig ist nicht das spezifische Ranking, sondern das Verständnis der Faktoren, die die Rangliste beeinflussen: Vorschriften für die Regulierung, institutionelle Investitionen, Defi -Integration, Benutzererfahrung, Sicherheit und Globalisierung. Binance, Coinbase, Kraken und andere werden voraussichtlich in die Top Ten eintreten, aber es können auch schwarze Swan -Ereignisse auftreten. Achten Sie auf Markttrends und Austauschtrends, glauben Sie nicht blind an Rankings und leisten Sie vor dem Investieren gute Arbeit.

Die neueste Zusammenfassung der formalen Handelsplattform 2025 Ethereum Die neueste Zusammenfassung der formalen Handelsplattform 2025 Ethereum Mar 26, 2025 pm 04:45 PM

Die Auswahl einer "formalen" Ethereum -Handelsplattform 2025 bedeutet Sicherheit, Einhaltung und Transparenz. Lizenzierte Operationen, finanzielle Sicherheit, transparente Operationen, AML/KYC, Datenschutz und fairer Handel sind von entscheidender Bedeutung. Konforme Börsen wie Coinbase, Kraken und Gemini sind es wert, auf die Aufmerksamkeit zu schalten. Binance und Ouyi haben die Möglichkeit, durch Stärkung der Einhaltung formaler Plattformen zu werden. Defi ist eine Option, aber es gibt Risiken. Achten Sie darauf, Sicherheit, Einhaltung, Ausgaben, Ausbreitungsrisiken, Sicherung privater Schlüssel und führen Sie Ihre eigenen Nachforschungen durch.

Wie optimieren Sie die Jieba -Word -Segmentierung, um den Effekt der Keyword -Extraktion von szenischen Spot -Kommentaren zu verbessern? Wie optimieren Sie die Jieba -Word -Segmentierung, um den Effekt der Keyword -Extraktion von szenischen Spot -Kommentaren zu verbessern? Apr 01, 2025 pm 06:24 PM

Wie optimieren Sie die Jieba -Word -Segmentierung, um die Keyword -Extraktion von malerischen Spot -Kommentaren zu verbessern? Bei Verwendung von Jieba -Word -Segmentierung zur Verarbeitung szenischer Spot -Kommentardaten, wenn die Ergebnisse der Wortsegmentierung ignoriert werden ...

Top 10 Digital Currency Exchange Ranking Neueste App Virtual Digital Currency Trading Platform App Top 10 Digital Currency Exchange Ranking Neueste App Virtual Digital Currency Trading Platform App Mar 25, 2025 pm 06:21 PM

Ranking of the top ten trading platforms digital currency apps: 1. OKX, 2. Binance, 3. Gate.io, 4. Coinbase, 5. Kraken, 6. Huobi, 7. KuCoin, 8. Crypto.com, 9. Bitfinex, 10. Gemini, when choosing transactions, you need to consider security, fees, currency selection, user experience, customer support and supervision, and investment should be cautious.

See all articles