OpenAI和Google接連兩天的大動作,都想讓AI助理成'精”
看過昨天OpenAI的春季發布後,不難猜到,在今天的谷歌I/O大會上,必然會有關於AI助理的介紹。
畢竟,搶在谷歌I/O大會前發布GPT-4o的Altman,已經顯示出了十足的針對性,憑藉Altman的手段,自然也有著十足的把握做到精準打擊,將這場「紅藍對抗」進行到底。
果不其然,大會上,GoogleCEO Pichai請來了DeepMind創始人Demis,Google全新的AI助手Project Astra正是由首次登台谷歌I/O大會的Demis揭開的神秘面紗。

什麼是Project Astra?
Project Astra是一個由GoogleGemini作為基礎引擎的即時、多模態通用人工智慧助手,相當於Google Assistant的繼任者。
與Siri、Alexa等以往我們使用的AI助理相同的是,你依然可以用語音與它進行交互;不同的是,借助生成式AI獨有的特性,它現在擁有了更好的理解能力、可以做更多事情,更重要的是,這次它還有了視覺辨識能力,讓AI助理得以睜眼看世界。
在大會上Google的影片示範中,著重示範的正是這位AI助理的視覺智慧。
在示範影片中,一位Google工程師拿著打開相機的手機,讓Gemini辨識空間中能發出聲音的物體、辨識顯示器螢幕上顯示的程式碼的功能,甚至透過戶外街景辨識示範者現在所在地址。

除了將AI助理應用到手機上,Google還將AI助理應用到了AR眼鏡上,當這位工程師將搭載這款AI助理的智慧眼鏡對準黑板上設計的系統並提出如何改善此系統時,AI助理甚至能給出系統設計的改善建議。

這是Google在AI助理上展現出的視覺智能,在Gemini加持下,這樣的AI助手在互動能力上已經得到了極大的增強。
不過,在實際互動的自然度上,這樣的AI助手依然與昨天OpenAI GPT-4o所展現的效果形成了不小的差距。
OpenAI「截胡」成功
就在GoogleI/O大會前一天,OpenAI召開了一場聲勢浩大的春季發布會,GPT-4o是這次春發的主角,部署在手機上的AI助理則是這次發表會重點展示的功能。
從OpenAI發布會上演示的AI助手能力來看,無論是在演示內容的親民程度、互動過程的自然度,還是這一AI助手多模態能力上,演示效果都要更好。
這是因為OpenAI將GPT-4o裝載到手機上時,不僅加入了視覺智能,還讓這個AI助手能夠實時響應(官方給出的平均響應延時是320毫秒) ,可以隨時被打斷,甚至還能理解人類的情緒。
在視覺智能方面能力演示過程中,OpenAI在紙上寫了一道數學方程式讓AI助理一步一步解題,像極了一位小學老師。

而當你和GPT-4o打「視訊電話」時,它又可以辨識你的臉部表情,理解你的情緒,知道你現在看起來是開心還是難過,活脫就是一個human being。

不難發現,在如今大模型技術加持下,Google和OpenAI都在試圖將原來粗糙不堪的AI助理進行回爐再造,想讓AI助理能像真人一樣與我們自然互動。
而從前後兩個發布會視頻演示結果來看,以大模型作為基礎引擎的AI助手,也確實讓我們明顯感受到了,現在的AI助手與此前的Siri、Alexa有了明顯的世代差。
實際上,在生成式AI、大模型技術發展如火如荼的當下,蘋果也在試圖讓Siri脫胎換骨,此前彭博社就曾援引知情人士消息報道稱,蘋果正與OpenAI和谷歌分別在談合作,想要將他們的大模型用到iOS 18作業系統中。
至於這樣的AI助理是否能讓Siri再次翻紅,成為AI手機的殺手級應用,接下來,就看蘋果能否再次為AI助理順利「附魔」了。
以上是OpenAI和Google接連兩天的大動作,都想讓AI助理成'精”的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

5月30日,騰訊宣布旗下混元大模型全面升級,基於混元大模型的App「騰訊元寶」正式上線,蘋果及安卓應用程式商店皆可下載。相較於先前測試階段的混元小程式版本,面向工作效率場景,騰訊元寶提供了AI搜尋、AI總結、AI寫作等核心能力;面向日常生活場景,元寶的玩法也更加豐富,提供了多個特色AI應用,並新增了創建個人智能體等玩法。 「騰訊做大模型不爭一時之先。」騰訊雲副總裁、騰訊混元大模型負責人劉煜宏表示:「過去的一年,我們持續推進騰訊混元大模型的能力爬坡,在豐富、海量的業務場景中打磨技術,同時洞察用戶的真實需求

火山引擎總裁譚待企業要做好大模型落地,面臨模型效果、推理成本、落地難度的三大關鍵挑戰:既要有好的基礎大模型做支撐,解決複雜難題,也要有低成本的推理服務讓大模型廣泛應用,還要更多工具、平台和應用程式幫助企業做好場景落地。 ——譚待火山引擎總裁01.豆包大模型首次亮相大使用量打磨好模型模型效果是AI落地最關鍵的挑戰。譚待指出,只有大的使用量,才能打磨出好模型。目前,豆包大模型日均處理1,200億tokens文字、生成3,000萬張圖片。為助力企業做好大模型場景落地,位元組跳動自主研發的豆包大模型將透過火山

一、背景簡介首先來介紹雲問科技的發展歷程。雲問科技公...2023年,正是大模型盛行的時期,很多企業認為已經大模型之後圖譜的重要性大大降低了,之前研究的預置的資訊化系統也都不重要了。不過隨著RAG的推廣、資料治理的盛行,我們發現更有效率的資料治理和高品質的資料是提升私有化大模型效果的重要前提,因此越來越多的企業開始重視知識建構的相關內容。這也推動了知識的建構和加工開始向更高層次發展,其中有許多技巧和方法可以挖掘。可見一個新技術的出現,並不是將所有的舊技術打敗,也有可能將新技術和舊技術相互融合後

注意看,這個男人把超1000種大模型接入,讓你可插拔無縫切換使用。最近也上線了可視化的AI工作流程:給你一個直覺的拖放介面,拖拖、拉拉、拽拽,就能在無限畫布上編排自己個兒的Workflow。正所謂兵貴神速,量子位聽說,這個AIWorkflow上線不到48小時,就已經有用戶配出了100多個節點的個人工作流程。不賣關子,今天要聊的是LLMOps公司Dify,及其CEO張路宇。張路宇也是Dify的創辦人。投入創業前,有11年的網路經驗。搞產品設計,懂專案管理,也對SaaS有點自己的獨到見解。後來他

4月4日消息,日前,國家網信辦公佈已備案大模型清單,中國移動「九天自然語言交互大模型」名列其中,標誌著中國移動九天AI大模型可正式對外提供生成式人工智慧服務。中國移動表示,這是同時透過國家「生成式人工智慧服務備案」和「境內深度合成服務演算法備案」雙備案的首個央企研發的大模型。據介紹,九天自然語言交互大模型具有產業能力增強、安全可信、支援全端國產化等特點,已形成90億、139億、570億、千億等多種參數量版本,可靈活部署於雲、邊、端不同場

如果試題太簡單,學霸和學渣都能考90分,拉不開差距……隨著Claude3、Llama3甚至之後GPT-5等更強模型發布,業界急需一款更難、更有區分度的基準測試。大模型競技場背後組織LMSYS推出下一代基準測試Arena-Hard,引起廣泛關注。 Llama3的兩個指令微調版本實力到底如何,也有了最新參考。與先前大家分數都相近的MTBench相比,Arena-Hard區分度從22.6%提升到87.4%,孰強孰弱一目了然。 Arena-Hard利用競技場即時人類數據構建,與人類偏好一致率也高達89.1%

如果AI模型給的答案一點也看不懂,你敢用嗎?隨著機器學習系統在更重要的領域中得到應用,證明為什麼我們可以信任它們的輸出,並明確何時不應信任它們,變得越來越重要。獲得對複雜系統輸出結果信任的一個可行方法是,要求系統對其輸出產生一種解釋,這種解釋對人類或另一個受信任的系統來說是可讀的,即可以完全理解以至於任何可能的錯誤都可以被發現。例如,為了建立對司法系統的信任,我們要求法院提供清晰易讀的書面意見,解釋並支持其決策。對於大型語言模型來說,我們也可以採用類似的方法。不過,在採用這種方法時,確保語言模型生

Ollama是一款超實用的工具,讓你能夠在本地輕鬆運行Llama2、Mistral、Gemma等開源模型。本文我將介紹如何使用Ollama實現對文本的向量化處理。如果你本地還沒有安裝Ollama,可以閱讀這篇文章。本文我們將使用nomic-embed-text[2]模型。它是一種文字編碼器,在短的上下文和長的上下文任務上,效能超越了OpenAItext-embedding-ada-002和text-embedding-3-small。啟動nomic-embed-text服務當你已經成功安裝好o
