目次
Gemini 1.5 Pro
オープン言語モデル - RecurrentGemma
ホームページ テクノロジー周辺機器 AI 完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

Apr 10, 2024 pm 02:34 PM
python git ai モデル ビデオ編集

今週火曜日、Google は Google Cloud Next 2024 で一連の AI 関連モデルのアップデートと製品をリリースしました。これには、ローカル音声 (音声) 理解機能とコード生成を初めて提供する Gemini 1.5 Pro が含まれます。新モデルCodeGemma、初の自社開発ArmプロセッサAxionなど。

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

Gemini 1.5 Pro

Gemini 1.5 Pro は、Google の最も強力な生成 AI モデルであり、現在利用可能ですGoogle のエンタープライズ向け AI 開発プラットフォームである Vertex AI のパブリック プレビュー中。 Google の企業向け AI 開発プラットフォームです。処理できるコンテキストは 128,000 トークンから 100 万トークンに増加します。 100 万トークンは、約 700,000 ワード、または約 30,000 行のコードに相当します。これは、Anthropic の主力モデルである Claude 3 が入力として処理できるデータ量の約 4 倍、OpenAI の GPT-4 Turbo の最大コンテキスト量の約 8 倍です。

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

公式原文リンク: https://developers.googleblog.com/2024/04/gemini-15-pro-in-public-プレビュー -with-new-features.html

このバージョンでは、ローカル オーディオ (音声) 理解機能と新しいファイル API が初めて提供され、ファイル処理が容易になります。 Gemini 1.5 Pro の入力モードは、Gemini API および Google AI Studio でのオーディオ (音声) 理解を含むように拡張されています。さらに、Gemini 1.5 Pro は、Google AI Studio にアップロードされたビデオの画像 (フレーム) とオーディオ (音声) の推論を実行できるようになりました。

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

Jeff Dean によるこの講演など、117,000 トークンを超える講演の録音をアップロードできます。Gemini 1.5 Pro はそれを次のように変換できます。答えのあるテスト。 (デモが高速化されました)

Google は、主に次の 3 つの内容を含む Gemini API の改善も行いました。 AI Studio と Gemini API では、モデルの応答をガイドするために Google システム命令が使用されます。役割、形式、目標、ルールを定義して、特定のユースケースにおけるモデルの動作をガイドします。

Google AI Studio でシステム命令を簡単に設定完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

2.JSON モード: モデルが出力JSONオブジェクトのみ。このパターンにより、テキストや画像から構造化データを抽出できます。 cURL が利用可能になり、Python SDK のサポートも近日中に開始されます。

3. 関数呼び出しの改善: モデルの出力を制限し、信頼性を向上させるモードを選択できるようになりました。テキスト、関数呼び出し、または関数自体を選択します。

さらに、Google は、同様のモデルよりも優れた次世代のテキスト埋め込みモデルをリリースする予定です。本日より、開発者は Gemini API を通じて次世代のテキスト埋め込みモデルにアクセスできるようになります。この新しいモデル text-embedding-004 (Vertex AI では text-embedding-preview-0409) は、MTEB ベンチマークでより強力な検索パフォーマンスを実現し、同等のディメンションを持つ既存のモデルを上回るパフォーマンスを発揮します。

#MTEB ベンチマークでは、256 ディメンションの出力を使用する Text-embedding-004 (別名 Gecko) が、より大きな 768 ディメンションの出力モデルすべてを上回っています

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

#ただし、Vertex AI および AI Studio にアクセスできないユーザーは Gemini 1.5 Pro を利用できないことに注意することが重要です。現在、ほとんどの人が Gemini チャットボットを通じて Gemini 言語モデルに取り組んでいます。 Gemini Ultra は Gemini Advanced チャットボットを強化しており、強力で長いコマンドを理解できますが、Gemini 1.5 Pro ほど高速ではありません。

3 つの主要なオープンソース ツール

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

2024 年の Google Cloud Next カンファレンスで、同社は主に生成 AI プロジェクトとインフラストラクチャをサポートするために使用される複数のオープンソース ツール。 1 つは Max Diffusion で、XLA (Accelerated Linear Algebra) デバイス上で実行されるさまざまな拡散モデルのリファレンス実装のコレクションです。

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

GitHub アドレス: https://github.com/google/maxdiffusion

2 つ目は、実行生成方式の Jetstream AI モデル用の新しいエンジン。現在、JetStream は TPU のみをサポートしていますが、将来的には GPU と互換性がある可能性があります。 Google は、JetStream は Google の Gemma 7B や Meta の Llama 2 などのモデルと比べて、価格/パフォーマンスが最大 3 倍になると主張しています。

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました


GitHub アドレス: https://github.com/google/JetStream

3 つ目は、クラウド内の TPU および Nvidia GPU 用のテキスト生成 AI モデルのコレクションである MaxTest です。 MaxText には現在、Gemma 7B、OpenAI の GPT-3、Llama 2、および AI スタートアップ Mistral のモデルが含まれており、Google によれば、これらはすべて開発者のニーズに合わせてカスタマイズおよび微調整できるとのことです。

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

GitHub アドレス: https://github.com/google/maxtext

最初の自己Arm プロセッサ Axion の研究を行いました

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

Google Cloud は、Axion と呼ばれる初の自社開発 Arm プロセッサの発売を発表しました。 Arm の Neoverse 2 をベースにしており、データセンター向けに設計されています。 Googleによれば、同社のAxionインスタンスは、AWSやMicrosoftなどの競合他社の他のArmベースのインスタンスよりもパフォーマンスが30%優れており、対応するX86ベースのインスタンスと比べてパフォーマンスが最大50%向上し、エネルギー効率が60%向上しているという。

Google は火曜日の発表会で、Axion はオープン基盤上に構築されているため、Google Cloud の顧客は既存の Arm ワークロードを何も変更せずに Google Cloud に持ち込むことができると強調しました。

ただし、Google はこれに関する詳細な紹介をまだリリースしていません。

コード補完および生成ツール—CodeGemma

CodeGemma は Gemma モデルに基づいており、強力で軽量なツールをコミュニティに提供します。関数。このモデルは、特にコード補完とコード生成タスクを処理する 7B 事前トレーニング済みバリアント、コード チャットとコマンド追従用の 7B コマンド調整済みバリアント、およびローカルで高速コード補完を実行する 2B 事前トレーニング済みバリアントに分けることができます。コンピューターのバリエーション。

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

CodeGemma には次の大きな利点があります:

    インテリジェントなコード補完と生成: 完全ローカルで作業しているかクラウドで作業しているかに関係なく、行、関数、さらにはコードのブロック全体を生成することもできます。5,000 億トークンの英語データがトレーニングされ、生成されたコードは文法的に正しいだけでなく、意味的にもより意味のあるものになります。エラーとデバッグ時間の削減に役立ちます;
  • 多言語機能: Python、JavaScript、Java、およびその他の一般的なプログラミング言語をサポートします;
  • ワークフローを簡素化: CodeGemma を開発環境に統合して、定型的なコードの作成を減らし、重要なコードをより速く、興味深い、差別化されたコードを作成します。
  • # CodeGemma と他の主流のコード大規模モデルとの比較結果の一部を以下の図に示します。

##GSM8K、MATH、およびその他のデータセットに関する CodeGemma 7B モデルと Gemma 7B モデルの比較結果。

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

技術的な詳細と実験結果については、Google が同時に公開した論文を参照してください。

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

文書のアドレス: https://storage.googleapis.com/deepmind-media/gemma/codegemma_report.pdf

オープン言語モデル - RecurrentGemma

Google DeepMind は、一連のオープン ウェイト言語モデル - RecurrentGemma もリリースしました。 RecurrentGemma は Griffin アーキテクチャに基づいており、グローバル アテンションをローカル アテンションと線形再帰の組み合わせで置き換えることにより、長いシーケンスを生成する際の高速推論を可能にします。

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

#技術レポート: https://storage.googleapis.com/deepmind-media/gemma/recurrentgemma-report.pdf

RecurrentGemma-2B は、Gemma-2B (トランスフォーマー アーキテクチャ) に匹敵する、ダウンストリーム タスクで優れたパフォーマンスを実現します。

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

同時に、RecurrentGemma-2B は、推論中、特に長いシーケンスでより高いスループットを実現します。

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

動画編集ツール - Google Vids

Google Vids は AI 動画作成ツールです。 Google Workspace に追加された新機能。

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

Google Vids を使用すると、ユーザーはドキュメントやスプレッドシートなどの他の Workspace ツールと並行して動画を作成し、同僚とリアルタイムで共同作業できると Google は述べています。

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

エンタープライズ固有のコード アシスタント ——Gemini Code Assist

Gemini Code Assist はエンタープライズ向けです。 GitHub Copilot Enterprise に対してベンチマークされた、特定のコード アシスタント AI コード補完および補助ツール。 Code Assist は、VS Code や JetBrains などの人気のあるエディタのプラグインとして利用可能になります。

完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しました

画像ソース: https://techcrunch.com/2024/04/09/google-launches-code-assist-its-latest- Challenger-to-githubs-copilot/

Code Assist は Gemini 1.5 Pro を利用しています。 Gemini 1.5 Pro には 100 万トークンのコンテキスト ウィンドウがあり、これにより Google のツールは競合他社よりも多くのコンテキストを導入できます。 Googleによれば、これはCode Assistがより正確なコード提案を提供し、コードの大部分を推論して変更する機能を提供できることを意味するとしている。

Google は次のように述べています。「Code Assist を使用すると、顧客はコード ベース全体に大規模な変更を加えることができ、これまで不可能だった AI 支援によるコード変換が可能になります。」

Agent Builder ——Vertex AI

AI エージェントは、今年注目の業界開発の方向性です。 Google は、企業による AI エージェントの構築を支援する新しいツールである Vertex AI Agent Builder を発表しました。

Google Cloud の CEO、トーマス クリアン氏は次のように述べています。「Vertex AI Agent Builder を使用すると、本番環境に対応した AI 主導の生成会話を非常に簡単かつ迅速に構築してデプロイできます。エージェントは次のことができます。」人間と同じようにエージェントをガイドして、モデルが生成した結果の品質と正確性を向上させます。」

#

以上が完全な画期的な進歩として、Google は昨夜、多数の大型モデル製品を更新しましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明
この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Undresser.AI Undress

Undresser.AI Undress

リアルなヌード写真を作成する AI 搭載アプリ

AI Clothes Remover

AI Clothes Remover

写真から衣服を削除するオンライン AI ツール。

Undress AI Tool

Undress AI Tool

脱衣画像を無料で

Clothoff.io

Clothoff.io

AI衣類リムーバー

Video Face Swap

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

メモ帳++7.3.1

メモ帳++7.3.1

使いやすく無料のコードエディター

SublimeText3 中国語版

SublimeText3 中国語版

中国語版、とても使いやすい

ゼンドスタジオ 13.0.1

ゼンドスタジオ 13.0.1

強力な PHP 統合開発環境

ドリームウィーバー CS6

ドリームウィーバー CS6

ビジュアル Web 開発ツール

SublimeText3 Mac版

SublimeText3 Mac版

神レベルのコード編集ソフト(SublimeText3)

ビットコインの価値はいくらですか ビットコインの価値はいくらですか Apr 28, 2025 pm 07:42 PM

ビットコインの価格は20,000ドルから30,000ドルの範囲です。 1。ビットコインの価格は2009年以来劇的に変動し、2017年には20,000ドル近くに達し、2021年にはほぼ60,000ドルに達しました。2。価格は、市場需要、供給、マクロ経済環境などの要因の影響を受けます。 3.取引所、モバイルアプリ、ウェブサイトを通じてリアルタイム価格を取得します。 4。ビットコインの価格は非常に不安定であり、市場の感情と外部要因によって駆動されます。 5.従来の金融市場と特定の関係を持ち、世界の株式市場、米ドルの強さなどの影響を受けています。6。長期的な傾向は強気ですが、リスクを慎重に評価する必要があります。

2025年のトップ10の通貨取引プラットフォームのどれがトップ10の通貨取引プラットフォームの1つです 2025年のトップ10の通貨取引プラットフォームのどれがトップ10の通貨取引プラットフォームの1つです Apr 28, 2025 pm 08:12 PM

2025年の世界の上位10の暗号通貨取引所には、Binance、Okx、Gate.io、Coinbase、Kraken、Huobi、Bitfinex、Kucoin、Bittrex、Poloniexが含まれます。これらはすべて、高い取引量とセキュリティで知られています。

トップ通貨取引プラットフォームは何ですか?トップ10の最新の仮想通貨交換 トップ通貨取引プラットフォームは何ですか?トップ10の最新の仮想通貨交換 Apr 28, 2025 pm 08:06 PM

現在、上位10の仮想通貨交換にランクされています。1。Binance、2。Okx、3。Gate.io、4。CoinLibrary、5。Siren、6。HuobiGlobal Station、7。Bybit、8。Kucoin、9。Bitcoin、10。BitStamp。

世界のトップ10の通貨取引プラットフォームのどれがトップ10の通貨取引プラットフォームの最新バージョンです 世界のトップ10の通貨取引プラットフォームのどれがトップ10の通貨取引プラットフォームの最新バージョンです Apr 28, 2025 pm 08:09 PM

世界の上位10の暗号通貨取引プラットフォームには、Binance、Okx、Gate.io、Coinbase、Kraken、Huobi Global、Bitfinex、Bittrex、Kucoin、Poloniexが含まれます。これらはすべて、さまざまな取引方法と強力なセキュリティ対策を提供します。

トップ10の仮想通貨取引アプリは何ですか?最新のデジタル通貨交換ランキング トップ10の仮想通貨取引アプリは何ですか?最新のデジタル通貨交換ランキング Apr 28, 2025 pm 08:03 PM

Binance、OKX、Gate.ioなどの上位10のデジタル通貨交換は、システムを改善し、効率的な多様化したトランザクション、厳格なセキュリティ対策を改善しました。

CでChronoライブラリを使用する方法は? CでChronoライブラリを使用する方法は? Apr 28, 2025 pm 10:18 PM

CでChronoライブラリを使用すると、時間と時間の間隔をより正確に制御できます。このライブラリの魅力を探りましょう。 CのChronoライブラリは、時間と時間の間隔に対処するための最新の方法を提供する標準ライブラリの一部です。 Time.HとCtimeに苦しんでいるプログラマーにとって、Chronoは間違いなく恩恵です。コードの読みやすさと保守性を向上させるだけでなく、より高い精度と柔軟性も提供します。基本から始めましょう。 Chronoライブラリには、主に次の重要なコンポーネントが含まれています。STD:: Chrono :: System_Clock:現在の時間を取得するために使用されるシステムクロックを表します。 STD :: Chron

今日のビットコイン価格 今日のビットコイン価格 Apr 28, 2025 pm 07:39 PM

今日のビットコインの価格変動は、マクロ経済学、政策、市場感情などの多くの要因の影響を受けています。投資家は、情報に基づいた決定を下すために、技術的および基本的な分析に注意を払う必要があります。

CでDMA操作を理解する方法は? CでDMA操作を理解する方法は? Apr 28, 2025 pm 10:09 PM

CのDMAとは、直接メモリアクセステクノロジーであるDirectMemoryAccessを指し、ハードウェアデバイスがCPU介入なしでメモリに直接データを送信できるようにします。 1)DMA操作は、ハードウェアデバイスとドライバーに大きく依存しており、実装方法はシステムごとに異なります。 2)メモリへの直接アクセスは、セキュリティリスクをもたらす可能性があり、コードの正確性とセキュリティを確保する必要があります。 3)DMAはパフォーマンスを改善できますが、不適切な使用はシステムのパフォーマンスの低下につながる可能性があります。実践と学習を通じて、DMAを使用するスキルを習得し、高速データ送信やリアルタイム信号処理などのシナリオでその効果を最大化できます。

See all articles