Google チームは、AI テクノロジーを使用してユーザーの写真と検索エンジンのクエリ情報を処理し、ユーザーの生活がどのようなものかを総合的に分析するというアイデアを提案しました。通称「エルマン計画」。
当初のアイデアによれば、Project Ellmann は LLM (Gemini など) を使用して情報を抽出し、ユーザーの写真から特定のパターンを見つけて、質問に正確に答えるチャットボットを構築します。 Googleは、エルマン氏は「個人的な人生の語り手」になるだろうと主張している。
面白そうですが、Google は Ellmann の機能を Google フォトや他の製品に埋め込みたいのでしょうか?それはまだ不明です。 Google フォトには 10 億人以上のユーザーがおり、4 兆枚の写真や動画が保存されています。
Google は現在、自社の製品ラインを最適化するために AI テクノロジーを活用しており、Ellmann はその活用方法の 1 つにすぎません。数日前、Google は Gemini を発表しました。場合によっては、Gemini は OpenAI GPT-4
をも超えています。Google は、Gemini の助けを借りて必要な機能を開発できる Google Cloud ユーザーに Gemini のライセンスを供与する予定です。 Gemini の最大の利点は「マルチモーダル」です。これは、テキスト、画像、ビデオ、音声など、複数の種類の情報を理解できることを意味します。
最近の社内会議で、Google フォトの幹部が Project Ellman を披露しました。内部文書によると、Google チームは大規模な言語モデルを使用して、現実世界でのユーザーのライフ ストーリーを「鳥瞰図」で表示できると考えていることがわかります。
エルマンは、伝記、過去の記録、写真を読むことで、状況をより深く理解することができました。たとえば、エルマン氏は一連のクリップを分析することで、その情報が大学生活のトピックに触れているかどうかを判断できます。プレゼンテーション スライドの一文には次のように書かれています。パズルを解いてストーリーを伝えることはできない」と別の人は言った、「私たちはあなたの写真を見て、そのタグと場所を調べて、それが何か意味のあるものに属しているかどうかを判断します。瞬間。あなたの個人的なストーリーがより明確になるでしょう」私たちはあなたの人生を総合的に見ます。」
Google チームは Ellmann Chat についても話しました。エルマンチャットとは何ですか?研究チームは次のように説明しています。「これを開いたときには、あなたの個人的な生活に関連するすべてをすでに知っていると想像したほうがよいでしょう。あなたならどんな質問をしますか?」
たとえば、ユーザーはエルマン チャットに質問をしました。 : 「犬を飼っていますか?」 AI は、飼い主が犬を飼っていると答え、その犬の名前も言いました。また、家族の中で犬と一緒にいるのが一番好きな人が 2 人いると言いました。その名前は何ですか?家族のメンバー。
もう 1 つの問題は、所有者が引っ越しを希望しているため、AI が既存の住環境に似たいくつかの街を選択できるようにすることです。エルマン氏はこれらの質問に答えることができます。それだけでなく、エルマン氏はユーザーの食生活についても知っています。
たとえば、ユーザーが何かを購入したいとき、何に興味があるのか、どのような仕事や旅行の計画があるのか、エルマンは写真を分析することで答えを見つけることができます。エルマン氏はまた、ユーザーがどのウェブサイトにアクセスし、どのアプリを使用するかについても把握しているとし、グーグルの広報担当者は「グーグルフォトは、ユーザーが写真やビデオを検索できるよう人工知能技術を活用したいと常に考えてきた。LLMを使用することで、より実用的な体験を提供できる」と明らかにした。 。現在、Ellmann はまだ社内での検討の初期段階にあり、最終的にリリースされるかどうかを判断するには時間がかかります。Google は、ユーザーのプライバシーとセキュリティも考慮しながら、Ellmann がユーザーにとって真に役立つものであることを確認する必要があります。」
##新しいテクノロジーを利用して、ユーザーにとってよりパーソナライズされた個人的な思い出を作りたいと考えているテクノロジー企業は数多くありますが、Project Ellmann はその 1 つです。 Google フォトでも Apple フォトでも、写真を分析し、パターンを見つけて、フォト アルバムを作成します。 Google フォトでは、ユーザーが簡単に検索できるように、類似した写真をアルバムに自動的にグループ化できます。 Appleは6月、同社のソフトウェアはアップグレード後に写真に写っている人、犬、猫を識別できるようになり、ユーザーはその人の名前を言うだけで、ソフトウェアが写真を見つけるのに役立つと発表した。 それはいいことのように聞こえますが、Google と Apple のテクノロジーにはまだ不完全な点があり、時々エラーが発生します。 2015年、アップルとグーグルの人工知能が黒人をチンパンジーと誤認し、多くのジョークを引き起こしたミスだった。今でもこの種の間違いを避けるのは難しいです以上がGemini AI 大型モデルのシーンを探している Google Project Ellman プロジェクトが公開されましたの詳細内容です。詳細については、PHP 中国語 Web サイトの他の関連記事を参照してください。