25個AI智能體源碼現已公開,靈感來自史丹佛的「虛擬小鎮」和《西方世界》
熟悉《西方世界》的觀眾都了解,這部劇設定在未來世界的一個巨大高科技成人主題樂園中,機器人們具備與人類相似的行為能力,能夠記憶所見所聞,重複核心故事情節。每天,這些機器人都會被重置,回到初始狀態
在史丹佛論文《 Generative Agents: Interactive Simulacra of Human Behavior 》發布後,這種情景不再僅限於影視劇中,AI 已經成功復現了這一場景
Smallville 的「虛擬小鎮」概覽圖
- ##論文網址:https://arxiv.org/pdf/2304.03442v1.pdf
- 專案網址:https://github.com/joonspk-research/generative_agents
研究人員成功創建了一個名為Smallville的虛擬小鎮,裡面有25個AI智能體,他們在小鎮上生活,有工作,交流八卦,參與社交活動,結交新朋友,甚至舉辦情人節派對。每個小鎮居民都有獨特的個性和背景故事
為了增加「小鎮居民」的真實感,Smallville 小鎮提供了多個公共場景,如咖啡館、酒吧、公園、學校、宿舍、房屋和商店。在Smallville 中,居民可以自由地在這些地方之間移動,與其他居民互動,甚至互相打招呼
小鎮居民的行為如何類似人類?例如,當他們看到早餐著火時,會主動走過去關掉爐子;當他們發現浴室有人時,會在外面等待;當遇到想交談的人時,會停下來聊天…
#可惜的是,當時這項研究並沒有公開,只能透過公開的論文來獲得更多資訊。然而,現在隨著時間的推移,研究者已經將這項研究開源了
這一消息也得到了史丹佛博士生和論文作者之一Joon Sung Park 的證實
除了斯坦福开源的 Smallville「虚拟小镇」,我们还要列举其他一些 AI 智能体 初创公司 Fable 利用 AI 智能体,通过完全由 AI 完成的编剧、动画、导演、编辑等制作流程,成功拍摄了一集《南方公园》 英伟达 AI 智能体 Voyager 接入 GPT-4,无需人类插手,就能玩《我的世界》。 商汤和清华等机构合作开发的通才 AI 智能体 Ghost in the Minecraft (GITM) 在《我的世界》中展现出超越以往所有智能体的卓越表现,并显著降低了训练成本 由于还有更多的研究,我们无法一一列举。随着斯坦福虚拟小镇的开源,我们相信会有更多的公司和机构加入这个行列
以上是25個AI智能體源碼現已公開,靈感來自史丹佛的「虛擬小鎮」和《西方世界》的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

AI Hentai Generator
免費產生 AI 無盡。

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

熱門話題

文字標註工作是將標籤或標記與文字中特定內容相對應的工作。其主要目的是為文本提供額外的信息,以便進行更深入的分析和處理,尤其是在人工智慧領域。文字標註對於人工智慧應用中的監督機器學習任務至關重要。用於訓練AI模型,有助於更準確地理解自然語言文本訊息,並提高文本分類、情緒分析和語言翻譯等任務的表現。透過文本標註,我們可以教導AI模型識別文本中的實體、理解上下文,並在出現新的類似數據時做出準確的預測。本文主要推薦一些較好的開源文字標註工具。 1.LabelStudiohttps://github.com/Hu

圖像標註是將標籤或描述性資訊與圖像相關聯的過程,以賦予圖像內容更深層的含義和解釋。這個過程對於機器學習至關重要,它有助於訓練視覺模型以更準確地識別圖像中的各個元素。透過為圖像添加標註,使得電腦能夠理解圖像背後的語義和上下文,從而提高對圖像內容的理解和分析能力。影像標註的應用範圍廣泛,涵蓋了許多領域,如電腦視覺、自然語言處理和圖視覺模型具有廣泛的應用領域,例如,輔助車輛識別道路上的障礙物,幫助疾病的檢測和診斷透過醫學影像識別。本文主要推薦一些較好的開源免費的圖片標註工具。 1.Makesens

人臉偵測辨識技術已經是一個比較成熟且應用廣泛的技術。而目前最廣泛的網路應用語言非JS莫屬,在Web前端實現人臉偵測辨識相比後端的人臉辨識有優勢也有弱勢。優點包括減少網路互動、即時識別,大大縮短了使用者等待時間,提高了使用者體驗;弱勢是:受到模型大小限制,其中準確率也有限。如何在web端使用js實現人臉偵測呢?為了實現Web端人臉識別,需要熟悉相關的程式語言和技術,如JavaScript、HTML、CSS、WebRTC等。同時也需要掌握相關的電腦視覺和人工智慧技術。值得注意的是,由於Web端的計

多模態文件理解能力新SOTA!阿里mPLUG團隊發布最新開源工作mPLUG-DocOwl1.5,針對高解析度圖片文字辨識、通用文件結構理解、指令遵循、外部知識引入四大挑戰,提出了一系列解決方案。話不多說,先來看效果。複雜結構的圖表一鍵識別轉換為Markdown格式:不同樣式的圖表都可以:更細節的文字識別和定位也能輕鬆搞定:還能對文檔理解給出詳細解釋:要知道,“文檔理解”目前是大語言模型實現落地的一個重要場景,市面上有許多輔助文檔閱讀的產品,有的主要透過OCR系統進行文字識別,配合LLM進行文字理

向大家介紹一個最新的AIGC開源專案-AnimagineXL3.1。這個專案是動漫主題文字到圖像模型的最新迭代,旨在為用戶提供更優化和強大的動漫圖像生成體驗。在AnimagineXL3.1中,開發團隊專注於優化了幾個關鍵方面,以確保模型在效能和功能上達到新的高度。首先,他們擴展了訓練數據,不僅包括了先前版本中的遊戲角色數據,還加入許多其他知名動漫系列的數據納入訓練集中。這項舉措豐富了模型的知識庫,使其能夠更全面地理解各種動漫風格和角色。 AnimagineXL3.1引入了一組新的特殊標籤和美學標

FP8和更低的浮點數量化精度,不再是H100的「專利」了!老黃想讓大家用INT8/INT4,微軟DeepSpeed團隊在沒有英偉達官方支援的條件下,硬生在A100上跑起FP6。測試結果表明,新方法TC-FPx在A100上的FP6量化,速度接近甚至偶爾超過INT4,而且比後者擁有更高的精度。在此基礎之上,還有端到端的大模型支持,目前已經開源並整合到了DeepSpeed等深度學習推理框架中。這項成果對大模型的加速效果也是立竿見影──在這種框架下用單卡跑Llama,吞吐量比雙卡還要高2.65倍。一名

论文地址:https://arxiv.org/abs/2307.09283代码地址:https://github.com/THU-MIG/RepViTRepViT在移动端ViT架构中表现出色,展现出显著的优势。接下来,我们将探讨本研究的贡献所在。文中提到,轻量级ViTs通常比轻量级CNNs在视觉任务上表现得更好,这主要归功于它们的多头自注意力模块(MSHA)可以让模型学习全局表示。然而,轻量级ViTs和轻量级CNNs之间的架构差异尚未得到充分研究。在这项研究中,作者们通过整合轻量级ViTs的有效

最新國產開源MoE大模型,剛亮相就火紅了。 DeepSeek-V2效能達GPT-4級別,但開源、可免費商用、API價格僅為GPT-4-Turbo的百分之一。因此一發布,立刻引發不小討論。圖片透過公佈的性能指標來看,DeepSeekV2的中文綜合能力超越一眾開源模型,同時GPT-4Turbo、文快4.0等閉源模型同處第一梯隊。英文綜合能力也和LLaMA3-70B同處第一梯隊,並且超過了同是MoE的Mixtral8x22B。在知識、數學、推理、程式設計等方面也表現出不錯性能。並支援128K上下文。圖片這
