数日前の新製品発表カンファレンスで、Google は Tensor G3 チップを搭載した新世代の Android フラッグシップ携帯電話 Pixel 8/Pro シリーズを正式にリリースしました このチップはより複雑な ML (機械学習) を実行できます さまざまな言語や「より自然な」音声でユーザーに Web ページを読み上げたり、より自然に話す仮想アシスタントなど、多数の AI 機能強化が追加されました。
Google は、Pixel 8 Pro が Google の基本的な大規模モデルをデバイス上で直接実行する最初のスマートフォンであると指摘しました。これには、Pixel 7 の最大の ML モデルの 150 倍の計算が必要です。
同時に、Googleは、携帯電話のパーソナルアシスタント機能と生成AIを組み合わせた、AndroidおよびiOSデバイス向けの「Bard Assistant (Assistant with Bard)」のリリースを発表しました。ユーザーはテキスト、音声、画像を使用して対話できます。 Bard アシスタントを使用すると、マルチモーダルになります。
ユーザーが「今週見逃した重要なメールは何ですか?」と尋ねると、Bard Assistant は次のサービスを提供します。まず、各重要なメールの重要なポイントと具体的な内容をリストし、対応するメールへのリンクを提供します。次に、ユーザーがアクティブな住所を抽出して Google マップに表示するのにも役立ちます
ユーザーが子犬の写真をソーシャル メディアに投稿したい場合は、吟遊詩人アシスタントのフローティング ダイアログ ボックスを呼び出して、投稿内容を書くように依頼するだけです。 Bard アシスタントは画像を認識し、対応するコンテンツを書き込みます。
Googleは、Bard Assistantを早期テスターに間もなく展開し、フィードバックを得て今後数か月以内に一般公開すると発表した。
さらに、DeepMind の共同創設者であるムスタファ・スレイマン氏は最近のインタビューで、
生成 AI の現在の段階は技術的な過渡期にすぎず、次にインタラクティブ AI の時代に入るだろうと述べています。ユーザーに基づいて さまざまなタスクのニーズに応じて、他のソフトウェアを手配したり、実際の担当者に連絡して作業を完了したりできます。 彼は、人工知能の最初の波は主に分類に焦点を当てていたと考えています。深層学習は、人間が人工知能を訓練して画像、ビデオ、オーディオ、言語などの入力データを分類できることを示しています。人類は現在、「データを入力し、新たなデータを生成する」という「生成型人工知能」の第2波の中にいます。将来の第 3 の波は「対話型人工知能」に属します。「会話は未来の対話型インターフェースです。」ユーザーはボタンをクリックしてテキストを入力するだけでなく、人工知能と直接対話します。自主的に行動を起こすことができる
天豊証券は、
CエンドAIアプリケーションのランディング段階におけるシナリオの重要性が強調されており、チャットロボット、AIコンパニオン、コンテンツ制作ツールのシナリオが最初に実装されており、開発スピードと商用化の進捗状況を指摘している。これらのシナリオにおける AI アプリケーションの数は予想を超える可能性があります。アナリストの予測によると、人工知能の反復とその後の出来事の触媒効果は加速し続けるでしょう。下半期には海外巨大企業のアプリケーションやモデルのイテレーション速度が大幅に向上し、一般的なチャットボットの機能もさらに強化されることが予想される。これにより、ユーザー エクスペリエンスが向上し、ユーザー数がさらに増加する可能性があります。
さらに、Huajin Securities は、大規模モデルの一般的なシナリオから垂直シナリオへの移行は、むしろ商業化の探求であり、大規模モデルがトレーニングから推論に移行する原動力であると付け加えました。垂直大型モデルの開発と改善では、大型モデルの適用が成長の余地を大きく開く鍵となります。エッジコンピューティングは明確で巨大なインクリメンタル市場であり、現在は業界導入段階に達しており、クラウドコンピューティング企業、通信事業者、機器メーカー、CDN企業などが積極的に業界導入を推進しています。
書き換えられた内容は次のとおりです: 出典: Financial Associated Press
以上がGoogle、マルチモーダルな吟遊詩人アシスタントをリリース:インタラクティブ AI 時代への新たなマイルストーンの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。