OpenAIとGoogleは2日連続で大きな動きを見せており、両社ともAIアシスタントを「スマート」にすることを目指している-AI-php.cn

プロジェクト・アストラとは何ですか?

ホームページ

テクノロジー周辺機器

OpenAIとGoogleは2日連続で大きな動きを見せており、両社ともAIアシスタントを「スマート」にすることを目指している

WBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWBOYWB

Jun 03, 2024 pm 03:23 PM

openai 大型モデル AIアシスタント

昨日の OpenAI の春リリースを見た後、今日の Google I/O カンファレンスで間違いなく AI アシスタントの紹介があることを推測するのは難しくありません。

結局のところ、Google I/O カンファレンスの前に GPT-4o をリリースしたアルトマンは、アルトマンの手法を十分に適切に活用して、正確に攻撃し、この「赤と青」の「対立」を最後まで排除することに当然の自信を持っています。。

案の定、Google CEO のピチャイは、DeepMind の創設者デミスを招待し、Google I/O カンファレンスでデビューした Google の新しい AI アシスタント Project Astra を発表しました。

OpenAIとGoogleは2日連続で大きな動きを見せており、両社ともAIアシスタントを「スマート」にすることを目指している

プロジェクト・アストラとは何ですか?

Project Astra は、Google Gemini を基本エンジンとして搭載したリアルタイムのマルチモーダル汎用人工知能アシスタントであり、Google アシスタントの後継に相当します。

これまで使用してきた Siri、Alexa、その他の AI アシスタントと同じように、音声を使用して対話することができます。違いは、生成 AI の独自の特性により、より優れた理解機能を備えていることです。より多くのこと、そしてさらに重要なことに、今回は視覚認識機能も備えており、AI アシスタントが目を見開いて世界を見ることができるようになりました。

カンファレンスでの Google のビデオデモンストレーションでは、この AI アシスタントの視覚的インテリジェンスに焦点が当てられていました。

デモビデオでは、Googleのエンジニアがカメラをオンにして携帯電話をかざすことで、Geminiが空間内で音を出す物体を識別し、モニター画面に表示されるコードを識別し、さらにはプレゼンターの現在の住所を識別できるようにしました。屋外のストリートビューを通して。

GoogleはAIアシスタントを携帯電話に適用するだけでなく、エンジニアがこのAIアシスタントを搭載したスマートグラスを黒板に設計されたシステムに向けて提案した際にもAIアシスタントを適用しました。システムを改善する方法については、AI アシスタントがシステム設計を改善するための提案を行うこともできます。

これは、GoogleがAIアシスタントに表示する視覚的知性であり、Geminiの恩恵により、そのようなAIアシスタントのインタラクティブ機能が大幅に強化されました。

しかし、実際のインタラクションの自然さという点では、このような AI アシスタントは、昨日 OpenAI GPT-4o によって実証された結果には依然として大きく遅れをとっています。

OpenAIは「切断」に成功しました

Google I/Oカンファレンスの前日、OpenAIは大規模な春のカンファレンスを開催しましたが、この春の主役は携帯電話に導入されたAIアシスタントです。このカンファレンスでデモされた機能。

OpenAIカンファレンスでデモンストレーションされたAIアシスタントの機能から判断すると、デモンストレーションコンテンツの使いやすさ、インタラクションプロセスの自然さ、このAIアシスタントのマルチモーダル機能の点でデモンストレーション効果は優れています。。

これは、OpenAI が GPT-4o を携帯電話にロードしたときに、視覚的インテリジェンスが追加されただけでなく、AI アシスタントがリアルタイムで応答できるようになったためです (公式の平均応答遅延は 320 ミリ秒です)いつ殴られても人間の感情さえ理解できる。

視覚知能機能のデモンストレーション中、OpenAI は小学校の教師のように、AI アシスタントが段階的に問題を解決できるように数式を紙に書きました。

そして、GPT-4o で「ビデオ通話」をすると、人間と同じように、あなたの表情を認識し、感情を理解し、今幸せに見えるか悲しんでいるかを知ることができます。

GoogleとOpenAIの両方が、今日の大規模モデルテクノロジーのサポートを利用して、オリジナルの大まかなAIアシスタントを再発明しようとしており、AIアシスタントが相互作用できることを期待していることを見つけるのは難しくありません。私たちと自然に本物の人間のように。

前後の2つのカンファレンスのビデオデモンストレーション結果から判断すると、大型モデルを基本エンジンとして使用したAIアシスタントは、確かに現在のAIアシスタントと以前のSiriの間に明確な世代の違いがあることをはっきりと感じさせました。そしてアレクサ。

実際、生成 AI と大型モデル技術の開発が本格化する中、Apple は Siri の再発明にも取り組んでおり、以前、この件に詳しい関係者の話として、Apple が OpenAI および Google Bring との協力について協議していると報じました。大規模なモデルを iOS 18 オペレーティングシステムにアップグレードします。

そのようなAIアシスタントがSiriを再び人気にし、AI携帯電話のキラーアプリケーションになることができるかどうかについては、Appleが再びAIアシスタントをうまく「魅了」できるかどうかにかかっています。

以上がOpenAIとGoogleは2日連続で大きな動きを見せており、両社ともAIアシスタントを「スマート」にすることを目指しているの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。

このウェブサイトの声明

この記事の内容はネチズンが自主的に寄稿したものであり、著作権は原著者に帰属します。このサイトは、それに相当する法的責任を負いません。盗作または侵害の疑いのあるコンテンツを見つけた場合は、admin@php.cn までご連絡ください。

ホットAIツール

Video Face Swap

完全無料の AI 顔交換ツールを使用して、あらゆるビデオの顔を簡単に交換できます。

ホットツール

ホットトピック

Java チュートリアル

1677

CakePHP チュートリアル

1430

Laravel チュートリアル

1333

PHP チュートリアル

1278

C# チュートリアル

1257

Related knowledge

ビッグモデルアプリ Tencent Yuanbao がオンラインになりました! Hunyuan がアップグレードされ、どこにでも持ち運べるオールラウンドな AI アシスタントが作成されました Jun 09, 2024 pm 10:38 PM

5月30日、TencentはHunyuanモデルの包括的なアップグレードを発表し、Hunyuanモデルに基づくアプリ「Tencent Yuanbao」が正式にリリースされ、AppleおよびAndroidアプリストアからダウンロードできるようになりました。前のテスト段階のフンユアンアプレットバージョンと比較して、Tencent Yuanbao は、日常生活シナリオ向けの AI 検索、AI サマリー、AI ライティングなどのコア機能を提供し、Yuanbao のゲームプレイもより豊富で、複数の機能を提供します。、パーソナルエージェントの作成などの新しいゲームプレイ方法が追加されます。 Tencent Cloud 副社長で Tencent Hunyuan 大型モデルの責任者である Liu Yuhong 氏は、「テンセントは、最初に大型モデルを開発しようとはしません。」と述べました。 Tencent Hunyuan の大型モデルは、ビジネスシナリオにおける豊富で大規模なポーランドテクノロジーを活用しながら、ユーザーの真のニーズを洞察します。

Bytedance Beanbao 大型モデルがリリース、Volcano Engine フルスタック AI サービスが企業のインテリジェントな変革を支援 Jun 05, 2024 pm 07:59 PM

Volcano Engine の社長である Tan Dai 氏は、大規模モデルを実装したい企業は、モデルの有効性、推論コスト、実装の難易度という 3 つの重要な課題に直面していると述べました。複雑な問題を解決するためのサポートとして、適切な基本的な大規模モデルが必要です。また、サービスは低コストの推論を備えているため、大規模なモデルを広く使用できるようになり、企業がシナリオを実装できるようにするためには、より多くのツール、プラットフォーム、アプリケーションが必要になります。 ——Huoshan Engine 01 社長、Tan Dai 氏。大きなビーンバッグモデルがデビューし、頻繁に使用されています。モデル効果を磨き上げることは、AI の実装における最も重要な課題です。 Tan Dai 氏は、良いモデルは大量に使用することでのみ磨かれると指摘しました。現在、Doubao モデルは毎日 1,200 億トークンのテキストを処理し、3,000 万枚の画像を生成しています。企業による大規模モデルシナリオの実装を支援するために、バイトダンスが独自に開発した豆包大規模モデルが火山を通じて打ち上げられます。

産業ナレッジグラフの高度な実践 Jun 13, 2024 am 11:59 AM

1. 背景の紹介まず、Yunwen Technology の開発の歴史を紹介します。 Yunwen Technology Company ...2023 年は大規模モデルが普及する時期であり、多くの企業は大規模モデルの後、グラフの重要性が大幅に低下し、以前に検討されたプリセット情報システムはもはや重要ではないと考えています。しかし、RAG の推進とデータガバナンスの普及により、より効率的なデータガバナンスと高品質のデータが民営化された大規模モデルの有効性を向上させるための重要な前提条件であることがわかり、ますます多くの企業が注目し始めています。知識構築関連コンテンツへ。これにより、知識の構築と処理がより高いレベルに促進され、探索できる技術や方法が数多く存在します。新しいテクノロジーの出現によってすべての古いテクノロジーが打ち破られるわけではなく、新旧のテクノロジーが統合される可能性があることがわかります。

GPT ストアはオープンすることさえできません。なぜこの国内プラットフォームがこのような道を歩むのでしょうか? ? Apr 19, 2024 pm 09:30 PM

この男性は 1,000 を超える大型モデルを接続し、シームレスに接続して切り替えることができることに注目してください。最近、ビジュアル AI ワークフローが開始されました。直感的なドラッグアンドドロップインターフェイスを提供し、ドラッグ、プル、ドラッグして、無限のキャンバス上に独自のワークフローを配置できます。ことわざにあるように、戦争にはスピードがかかります。Qubit は、この AIWorkflow がオンラインになってから 48 時間以内に、ユーザーがすでに 100 ノードを超える個人ワークフローを構成したと聞きました。早速ですが、今日私が話したいのは、LLMOps 企業である Dify とその CEO の Zhang Luyu についてです。 Zhang Luyu は Dify の創設者でもあります。ビジネスに入社する前は、インターネット業界で 11 年の経験がありました。私は製品設計に携わっており、プロジェクト管理を理解しており、SaaS について独自の洞察を持っています。その後彼は

GPT-4をベンチマーク！中国移動の九天大型モデルが二重登録を通過 Apr 04, 2024 am 09:31 AM

4月4日のニュースによると、中国サイバースペース局は最近、登録された大型モデルのリストを発表し、その中にチャイナモバイルの「九天自然言語インタラクション大型モデル」が含まれており、チャイナモバイルの九天AI大型モデルが生成人工言語を正式に提供できることを示した。外部世界への諜報機関。チャイナモバイルは、これは中央企業が開発した初めての大規模モデルであり、国家の「生成人工知能サービス登録」と「国内深層合成サービスアルゴリズム登録」の二重登録を通過したと述べた。報告によると、Juiutian の自然言語インタラクション大規模モデルは、強化された業界能力、セキュリティ、信頼性の特徴を持ち、フルスタックローカリゼーションをサポートしており、90 億、139 億、570 億、1000 億などのさまざまなパラメータバージョンを形成しており、クラウド、エッジ、エンドでは状況が異なりますが、柔軟に導入できます。

新しいテストベンチマークがリリース、最も強力なオープンソースのLlama 3が困惑 Apr 23, 2024 pm 12:13 PM

テストの問題が簡単すぎると、上位の生徒も下位の生徒も 90 点を獲得でき、その差は広がりません。Claude3、Llama3、さらには GPT-5 などのより強力なモデルが後にリリースされるため、業界はより困難で差別化されたモデルのベンチマークが緊急に必要です。大型モデルアリーナの背後にある組織 LMSYS は、次世代ベンチマーク Arena-Hard を発表し、広く注目を集めました。 Llama3 命令の 2 つの微調整されたバージョンの強度に関する最新のリファレンスもあります。全員が同様のスコアを持っていた以前の MTBench と比較すると、アリーナとハードの識別は 22.6% から 87.4% に増加し、一目で強くも弱くもなりました。 Arena-Hard は、アリーナからのリアルタイムの人間データを使用して構築されており、人間の好みとの一致率は 89.1% です。

OpenAI Super Alignment チームの遺作: 2 つの大きなモデルがゲームをプレイし、出力がより理解しやすくなる Jul 19, 2024 am 01:29 AM

AIモデルによって与えられた答えがまったく理解できない場合、あなたはそれをあえて使用しますか?機械学習システムがより重要な分野で使用されるにつれて、なぜその出力を信頼できるのか、またどのような場合に信頼してはいけないのかを実証することがますます重要になっています。複雑なシステムの出力に対する信頼を得る方法の 1 つは、人間または他の信頼できるシステムが読み取れる、つまり、考えられるエラーが発生する可能性がある点まで完全に理解できる、その出力の解釈を生成することをシステムに要求することです。見つかった。たとえば、司法制度に対する信頼を築くために、裁判所に対し、決定を説明し裏付ける明確で読みやすい書面による意見を提供することを求めています。大規模な言語モデルの場合も、同様のアプローチを採用できます。ただし、このアプローチを採用する場合は、言語モデルが

Embedding サービスのローカル実行パフォーマンスは OpenAI Text-Embedding-Ada-002 を上回っており、とても便利です。 Apr 15, 2024 am 09:01 AM

Ollama は、Llama2、Mistral、Gemma などのオープンソースモデルをローカルで簡単に実行できるようにする非常に実用的なツールです。この記事では、Ollamaを使ってテキストをベクトル化する方法を紹介します。 Ollama をローカルにインストールしていない場合は、この記事を読んでください。この記事では、nomic-embed-text[2] モデルを使用します。これは、短いコンテキストおよび長いコンテキストのタスクにおいて OpenAI text-embedding-ada-002 および text-embedding-3-small よりも優れたパフォーマンスを発揮するテキストエンコーダーです。 o が正常にインストールされたら、nomic-embed-text サービスを開始します。

See all articles

OpenAIとGoogleは2日連続で大きな動きを見せており、両社ともAIアシスタントを「スマート」にすることを目指している

プロジェクト・アストラとは何ですか?

ホットAIツール

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

Video Face Swap

人気の記事

ホットツール

メモ帳++7.3.1

SublimeText3 中国語版

ゼンドスタジオ 13.0.1

ドリームウィーバー CS6

SublimeText3 Mac版

ホットトピック