- 方向:
- 全部 網路3.0 後端開發 web前端 資料庫 運維 開發工具 php框架 每日程式設計 微信小程式 常見問題 其他 科技 CMS教程 Java 系統教程 電腦教學 硬體教學 手機教學 軟體教學 手遊教學
- 分類:
-
- 豆包大模型團隊發布全新Detail Image Caption評估基準,提升VLM Caption評測可靠性
- AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com目前的視覺語言模式(VLM)主要透過QA問答形式進行效能評測,而缺乏對模式基礎理解能力的評測,例如detailimagecaption效能的可靠評測。針對這一問題,中科院、
- 人工智慧 927 2024-07-18 20:10:02
-
- 三星中國Galaxy Z系列新品接取豆包大模型
- 7月17日,三星電子在中國市場發表新一代GalaxyZ系列產品。會上,三星電子與火山引擎官員合作,為GalaxyZFold6、GalaxyZFlip6手機的智慧助理及AI視覺接取豆包大模型,提升手機的智慧應用體驗。先前,三星在海外新品發表會上發表了與GoogleGemini的深度合作,在中國區則選擇了火山引擎等廠商作為大模型合作方。 fenye圖說:三星GalaxyZFold6、GalaxyZFlip6手機的智慧助理及AI視覺接取豆包大模型除了畫圈即搜、即時翻譯、錄音轉錄等已揭露過的AI功能外,本次中
- 人工智慧 646 2024-07-18 20:07:33
-
- 拋棄視覺編碼器,這個「原生版」多模態大模型也能媲美主流方法
- AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com一作刁海文,是大連理工大學博士生,導師是盧湖川教授。目前在北京智源人工智慧研究院實習,指導教師是王鑫龍博士。他的研究興趣是視覺與語言,大模型高效遷移,多模態大模型等。共同一作崔
- 人工智慧 423 2024-07-18 19:21:11
-
- 這些VLM竟都是盲人? GPT-4o、Sonnet-3.5相繼敗於「視力」測試
- 四大VLM,竟都在盲人摸象?讓現在最熱門的SOTA模型們(GPT-4o,Gemini-1.5,Sonnet-3,Sonnet-3.5)數一數兩條線有幾個交點,他們表現會比人類好嗎?答案很可能是否定的。自從GPT-4V推出以來,視覺語言模型(VLMs)讓大模型的智慧程度朝著我們想像中的人工智慧水準躍升了一大步。 VLMs既能看懂畫面,又能用語言來描述看到的東西,並基於這些理解來執行複雜的任務。例如,給VLM模型發去一張餐桌的圖片,再發一張菜單的圖片,它就能從兩張圖中分別提取啤酒瓶的數量和菜單上的單價,算
- 人工智慧 690 2024-07-18 18:18:02
-
- MotionClone:無需訓練,一鍵克隆視訊運動
- AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com無需訓練或微調,在提示詞指定的新場景中克隆參考視頻的運動,無論是全局的相機運動還是局部的肢體運動都可以一鍵搞定。論文:https://arxiv.org/abs/2406.05
- 人工智慧 1045 2024-07-18 17:06:12
-
- 人類模仿AI新賽道,AI:論瘋癲,你是我爹
- 機器之能報道編輯:楊文AI被人類帶壞!這個世界,太癲了……最近,社交媒體上冒出來一堆搞怪視頻,打著AI的旗號,真人cosAI,甚至抖音還專門出了個熱門話題——人類模仿AI大賽。 (影片來自抖音部落客「關妮亂石」)影片連結:https://mp.weixin.qq.com/s/1DVc8skecSsO0a9QcklZlw套路都一個樣兒:左邊一張舊照片,右邊打著「AI修復」的字幕,實際由真人演繹著腦幹缺失的狗血「劇情」。 -1-AI:第一次被人冒充,沒想到比我還抽
- 人工智慧 1788 2024-07-18 16:51:08
-
- 大模型推理效率無損提升3倍,滑鐵盧大學、北京大學等機構發表EAGLE
- 大语言模型(LLM)被越来越多应用于各种领域。然而,它们的文本生成过程既昂贵又缓慢。这种低效率归因于自回归解码的运算规则:每个词(token)的生成都需要进行一次前向传播,需要访问数十亿至数千亿参数的LLM。这导致传统自回归解码的速度较慢。近日,滑铁卢大学、加拿大向量研究院、北京大学等机构联合发布EAGLE,旨在提升大语言模型的推理速度,同时保证模型输出文本的分布一致。这种方法外推LLM的第二顶层特征向量,能够显著提升生成效率。技术报告:https://sites.google.com/view
- 人工智慧 1044 2024-07-18 14:43:48
-
- 有效評估Agent實際表現,新型線上評測架構WebCanvas來了
- 潘奕琛:浙江大學碩士一年級研究生。孔德涵:跨越星空科技模型演算法負責人。周思達:南昌大學2024年畢業生,將於西安電子科技大學攻讀碩士。崔成:浙江中醫藥大學2024屆畢業生,將於蘇州大學攻讀碩士。潘奕琛、週思達、崔成以跨越星空科技演算法實習生的身份共同完成了本論文的研究工作。在當今科技快速發展的時代,大型語言模型(LargeLanguageModel,LLM)正以前所未有的速度改變著我們與數位世界互動的方式。基於LLM的智慧型代理(LLMAgent),從簡單的資訊搜尋到複雜的網頁操作,它們正在逐步融入
- 人工智慧 636 2024-07-18 14:04:51
-
- AKOOL協助坎城廣告大獎,發表革命性即時數位人平台
- 2024年歐洲盃如火如荼進行之際,一則由法國電信公司Orange創作的足球比賽影片也迅速走紅。影片中,我們看到了姆巴佩、吉魯、格里茲曼......,實際上,所有在球場上奔跑的運動員都不是真人,而是人工智慧生成的虛擬角色。憑藉著出色創意和獨特性,該作品斬獲了廣告創意行銷界「奧斯卡」——今年的坎城國際創意節的體育類大獎。而AKOOL為這項大獎作品提供了核心技術支援。他們開發的AI面部捕捉系統能精確捕捉人臉細微表情和動作,在精心設計的渲染技術加持下,作品中的虛擬人物
- 人工智慧 565 2024-07-18 09:26:11
-
- 178頁,128個案例,GPT-4V醫療領域全面測評,離臨床應用與實際決策尚有距離
- 上海交大&上海AILab發表178頁GPT-4V醫療案例評測,首次全面揭秘GPT-4V醫療領域視覺表現。在大型基礎模式的推動下,人工智慧的發展近來取得了巨大進步,尤其是OpenAI的GPT-4,其在問答、知識方面展現出的強大能力點亮了AI領域的尤里卡時刻,引起了公眾的普遍關注。 GPT-4V(ision)是OpenAI最新的多模態基礎模型。相較於GPT-4,它增加了影像與語音的輸入能力。該研究則旨在透過案例分析評估GPT-4V(ision)在多模態醫療診斷領域的性能,總共展現並分析共了1
- 人工智慧 1262 2024-07-18 06:20:10
-
- ICML 2024 AI for Math Workshop 徵稿與挑戰賽啟動!
- ICML2024,AIforMathWorkshop以形式化和自然語言AI數學推理為導向的研討會時間:2024年7月26/27日地點:奧地利,維也納。現場、線上同步舉行。研討會首頁:https://sites.google.com/view/ai4mathworkshopicml2024/數學推理是人類智慧中最具挑戰性和最深刻的部分。人類在數學推理的發展過程中總結了各種形式化語言,得以嚴格地描述數學問題和證明過程。而近年來的機器學習演算法和大規模語言模型正逐步接近甚至超越人類在一些數學推理的表現
- 人工智慧 753 2024-07-18 05:36:50
-
- Meta開發System 2蒸餾技術,Llama 2對話模型任務準確率接近100%
- 研究者表示,如果Sytem2蒸餾可以成為未來持續學習AI系統的重要特徵,則可以進一步提升System2表現較不好的推理任務的表現。談到大語言模型(LLM)的策略,一般來說有兩種,一種是即時的System1(快速反應),另一種是System2(慢速思考)。其中System2推理傾向於深思熟慮的思維,產生中間思維允許模型(或人類)進行推理和規劃,以便成功完成任務或回應指令。在System2推理中,需要付出努力的心理活動,尤其是在System1(更自動化思考)可能出錯的情況下。因此,System1被
- 人工智慧 1175 2024-07-18 05:07:20
-
- 直擊真實的甲方AGI需求,人工智慧賦能產業融通發展論壇順利召開
- 7月6日,「2024WAIC人工智慧賦能產業融通發展論壇」在世博展覽館隆重舉行。本次論壇主要議題為探討人工智慧賦能新型工業化、促進產業融通發展的相關議題,包括領導致辭、簽約儀式、主題演講、央國企人工智慧場景需求發布和圓桌論壇等多個環節。許多來自央國企機構和人工智慧領域的企業參與,包括中國電子資訊產業發展研究院、中國移動研究院、中國石化勝利油田、國家電網客服中心、中電昱創、南方電網數位電網集團、達摩院、百度智慧雲端、創新奇智等。出席嘉賓圍繞著人工智慧在不同領域的應用實踐、大模型的發展與應用、智慧化維
- 人工智慧 575 2024-07-18 03:14:57
-
- 趕時髦的 AIGC 行銷人,如何實現「裡子」與「面子」的雙贏?
- AIGC技術在行銷領域的創新與安全過去一年,AI技術在各行各業掀起了一場變革狂潮。向來「趕時髦」的行銷圈,更是率先擁抱AIGC技術。相關數據顯示,2023年,我國已有近半數廣告主企業在線上行銷活動中應用AIGC技術,其中超過90%的應用聚焦於內容創作與創意開發。這種由科技驅動的廣告行銷新模式正在逐漸成型,為廣告主降本增效帶來更多可能。然而,AIGC技術在行銷領域大施拳腳的同時,也伴隨著許多挑戰。例如,AIGC技術在產生行銷素材時可能會產生內容風險,重金投入的行銷活動一不小心為黑產做了嫁衣。那麼,
- 人工智慧 874 2024-07-18 01:41:21
-
- ICML 2024 | 梯度檢查點太慢?不降速、省顯存,LowMemoryBP大幅提升反向傳播顯存效率
- AIxiv專欄是本站發布學術、技術內容的欄位。過去數年,本站AIxiv專欄接收通報了2,000多篇內容,涵蓋全球各大專院校與企業的頂尖實驗室,有效促進了學術交流與傳播。如果您有優秀的工作想要分享,歡迎投稿或聯絡報道。投稿信箱:liyazhou@jiqizhixin.com;zhaoyunfeng@jiqizhixin.com本文論文一作是南開大學統計與資料科學學院研二碩士生楊雨辰,指導老師為南開大學統計與資料科學學院的徐君副教授。徐君老師團隊的研究重點是電腦視覺、生成式AI和高效機器學習,並在頂
- 人工智慧 775 2024-07-18 01:39:51