Rumah > Peranti teknologi > AI > teks badan

Mencari adegan untuk projek Google Project Ellman model besar Gemini AI yang terdedah

PHPz
Lepaskan: 2023-12-15 09:46:01
ke hadapan
1085 orang telah melayarinya

为Gemini AI大模型找场景 谷歌Project Ellman项目曝光

Pasukan Google mencadangkan idea untuk menggunakan teknologi AI untuk memproses foto pengguna dan maklumat pertanyaan enjin carian untuk menganalisis secara menyeluruh kehidupan pengguna Projek ini dipanggil "Projek Ellmann".

Mengikut idea asal, Project Ellmann akan menggunakan LLM (seperti Gemini) untuk mengekstrak maklumat, mencari corak tertentu daripada foto pengguna, dan kemudian membina chatbot untuk menjawab soalan dengan tepat. Google mendakwa Ellmann akan menjadi "pencerita kehidupan peribadi."

Bunyinya menarik, tetapi adakah Google mahu membenamkan fungsi Ellmann ke dalam Google Photos atau ke dalam produk lain? Ia masih tidak diketahui. Foto Google mempunyai lebih daripada 1 bilion pengguna dan menyimpan 4 trilion foto atau video.

Google sedang menggunakan teknologi AI untuk mengoptimumkan barisan produknya, dan Ellmann hanyalah salah satu cara ia boleh digunakan. Beberapa hari yang lalu, Google melancarkan Gemini Dalam beberapa kes, Gemini telah mengatasi OpenAI GPT-4

Google berhasrat untuk melesenkan Gemini kepada pengguna Google Cloud. Kelebihan Gemini yang paling menonjol ialah "multi-modal", yang bermaksud bahawa ia boleh memahami pelbagai jenis maklumat seperti teks, gambar, video dan audio.

Pada mesyuarat dalaman baru-baru ini, seorang eksekutif dari bahagian Google Photos menunjukkan Projek Ellman. Dokumen dalaman menunjukkan bahawa pasukan Google percaya bahawa model bahasa yang besar boleh digunakan untuk memaparkan kisah hidup pengguna di dunia nyata dengan cara "mata burung".

Dengan membaca biografi, rekod terdahulu, gambar dan bahan lain, Ellman dapat memahami situasi dengan lebih mendalam. Sebagai contoh, dengan menganalisis satu siri klip, Ellman boleh menentukan sama ada maklumat itu menyentuh topik kehidupan kolej

Satu ayat dalam slaid pembentangan berbunyi: "Kami tidak dapat menyelesaikan masalah kehidupan individu tanpa melihatnya. pandangan mata burung." "Kami melihat foto anda, melihat tanda nama dan lokasinya serta menentukan sama ada ia tergolong dalam momen yang bermakna." Kisah peribadi anda akan menjadi lebih jelas semasa anda hidup. ”

Pasukan Google turut bercakap tentang Ellmann Chat. Apa itu Ellmann Chat? Pasukan itu menerangkan: "Anda mungkin juga membayangkan bahawa apabila anda membukanya, ia sudah mengetahui segala-galanya yang berkaitan dengan kehidupan peribadi anda, apakah soalan yang akan anda tanyakan?"

Sebagai contoh, pengguna bertanya kepada Ellmann Chat soalan: "Adakah saya ada apa-apa soalan?" "Angkat anjing." AI menjawab bahawa pemilik mempunyai seekor anjing, dan juga memberitahu nama anjing itu. Dia juga mengatakan bahawa terdapat dua orang dalam keluarga yang paling suka bersama anjing. Apa ialah nama ahli keluarga.

Masalah lain ialah pemilik ingin berpindah, jadi AI boleh menyediakan beberapa bandar untuk dipilih yang serupa dengan persekitaran tempat tinggal sedia ada. Ellmann boleh menjawab soalan-soalan ini. Bukan itu sahaja, Ellmann juga tahu apa itu tabiat pemakanan pengguna.

Sebagai contoh, apabila pengguna ingin membeli sesuatu, perkara yang mereka minati, kerja dan rancangan perjalanan yang mereka ada, Ellmann boleh mencari jawapannya dengan menganalisis foto. Ellmann juga mengetahui tapak web yang pengguna suka lawati dan apl yang mereka gunakan Seorang jurucakap Google mendedahkan: "Google Photos sentiasa berharap untuk menggunakan teknologi kecerdasan buatan untuk membantu pengguna mencari foto dan video. Dengan LLM, kami boleh memberikan Pengalaman yang lebih praktikal. Pada masa ini, Ellmann masih dalam peringkat awal penerokaan dalaman, dan ia akan mengambil masa untuk menentukan sama ada ia akhirnya akan dilancarkan oleh Google mesti memastikan bahawa Ellmann benar-benar membantu pengguna, sambil mempertimbangkan privasi dan keselamatan pengguna Banyak syarikat teknologi ingin melakukan ini, Project Ellmann hanyalah salah satu daripada banyak teknologi baharu yang menggunakan teknologi baharu untuk mencipta kenangan peribadi yang lebih diperibadikan untuk pengguna.

Sama ada Google Photos atau Apple Photos, mereka semua menganalisis foto, mencari corak dan kemudian mencipta album foto. Foto Google boleh mengumpulkan foto yang serupa secara automatik ke dalam album untuk carian mudah oleh pengguna. Apple berkata pada bulan Jun bahawa perisiannya akan dapat mengenal pasti orang, anjing atau kucing dalam foto selepas naik taraf Pengguna hanya perlu menyebut nama orang itu dan perisian itu akan membantu anda mencari foto mereka.

Bunyinya bagus, tetapi teknologi Google dan Apple masih mempunyai ketidaksempurnaan, dan ralat kadangkala berlaku. Pada 2015, Apple dan kecerdasan buatan Google tersilap mengenal pasti orang kulit hitam sebagai cimpanzi, kesilapan yang menyebabkan banyak jenaka. Sekarang pun kesilapan macam ni masih susah nak elak

Atas ialah kandungan terperinci Mencari adegan untuk projek Google Project Ellman model besar Gemini AI yang terdedah. Untuk maklumat lanjut, sila ikut artikel berkaitan lain di laman web China PHP!

Label berkaitan:
sumber:51cto.com
Kenyataan Laman Web ini
Kandungan artikel ini disumbangkan secara sukarela oleh netizen, dan hak cipta adalah milik pengarang asal. Laman web ini tidak memikul tanggungjawab undang-undang yang sepadan. Jika anda menemui sebarang kandungan yang disyaki plagiarisme atau pelanggaran, sila hubungi admin@php.cn
Tutorial Popular
Lagi>
Muat turun terkini
Lagi>
kesan web
Kod sumber laman web
Bahan laman web
Templat hujung hadapan