首個模擬人類認知的思考架構OlaGPT：六大模組增強語言模型，推理能力最高提升85%-人工智慧-PHP中文網

模擬人類的認知

OlaGPT

意圖增強（Intention Enhance）

首頁

科技週邊

人工智慧

首個模擬人類認知的思考架構OlaGPT：六大模組增強語言模型，推理能力最高提升85%

王林

Jun 05, 2023 pm 04:17 PM

語言模型

ChatGPT剛發布的時候，給了我們太多的震撼，模型在對話上的表現實在是太像人類了，以至於產生了語言模型具有「思考能力」的錯覺。

不過在深入了解語言模型之後，研究人員們也逐漸發現了，基於高機率語言模式的再現與期望中的「通用人工智慧」還有很大差距。

在目前的大多數研究中，大型語言模型主要是在特定提示的引導下生成思維鏈來執行推理任務，沒有考慮人類的認知框架，使得語言模型解決複雜推理問題的能力與人類之間仍然存在著顯著的差距。

人類在面對複雜的推理難題時，通常會使用各種認知能力，並且需要與工具、知識和外部環境資訊的各個方面進行交互，那語言模型能不能模擬人類的思維流程來解決複雜問題呢？

答案當然可以！首個模擬人類認知處理框架的模型OlaGPT來了！

首個模擬人類認知的思考架構OlaGPT：六大模組增強語言模型，推理能力最高提升85%

論文連結：https://arxiv.org/abs/2305.16334

程式碼連結：https://www.php.cn/link/ 73a1c863a54653d5e184b790fee14754

OlaGPT包括多個認知模組，包括注意力、記憶、推理、學習，以及相應的調度和決策機制；受人類主動學習啟發，框架中還包括一個學習單元來記錄之前的錯誤和專家意見，並動態參考來提升解決類似問題的能力。

首個模擬人類認知的思考架構OlaGPT：六大模組增強語言模型，推理能力最高提升85%

文中也概述了人類解決問題的常見有效推理框架，並相應地設計了思維鏈（CoT）模板；也提出了一個全面的決策機制，可以最大限度地提高模型的準確性。

在多個推理資料集上進行了嚴格評估後得到的實驗結果表明，OlaGPT超越了先前最先進的基準，證明了其有效性。

模擬人類的認知

目前的語言模型與期望中的通用人工智慧還有很大差距，主要表現為：

#1. 在某些情況下生成的內容毫無意義，或者偏離了人類的價值偏好，甚至會給出一些非常危險的建議，目前的解決方案是引入人類反饋的強化學習（RLHF）對模型輸出進行排序。

2. 語言模型的知識僅限於在訓練資料中明確提到的概念和事實。

在面對複雜問題時，語言模型也無法像人類一樣適應變化的環境、利用現有的知識或工具、反思歷史教訓、分解問題，以及使用人類在長期進化中總結出的思考模式（如類比、歸納推理和演繹推理等）來解決問題。

不過，讓語言模型模擬人腦處理問題的過程還有許多系統難題：

1. 如何系統地模仿和編碼人類認知框架中的主要模組，同時以可實現的方式根據人類的通用推理模式進行調度？

2. 如何引導語言模型像人類一樣進行主動學習，即從歷史錯誤或專家對困難問題的解決方案中學習和發展？

雖然重新訓練模型對修正後的答案進行編碼可能是可行的，但顯然成本很高且不靈活。

3. 如何讓語言模型靈活地利用人類演化出的各種思考模式，進而提升其推理表現？

一個固定的、通用的思考模式很難適應不同問題，就像人類在面對不同類型的問題時，通常會靈活地選擇不同的思考方式，如類比推理、演繹推理等。

OlaGPT

OlaGPT是一個模擬人類思維的問題解決框架，可以增強大型語言模型的能力。

OlaGPT借鑒了認知架構（cognitive architecture）理論，把認知框架的核心能力建模為注意力（attention）、記憶（memory）、學習（learning）、推理（reasoning）、行動選擇（action selction）。

研究人員根據具體實現的需要對該框架進行了微調，並提出了一個適合語言模型解決複雜問題的流程，具體包括六個模組：意圖增強模組（注意力）、記憶模組（記憶）、主動學習模組（學習）、推理模組（推理）、控制器模組（行動選擇）和投票模組。

首個模擬人類認知的思考架構OlaGPT：六大模組增強語言模型，推理能力最高提升85%

意圖增強（Intention Enhance）

#注意力是人類認知的一個重要組成部分，識別出相關的資訊並過濾掉不相關的數據。

同樣地，研究人員為語言模型設計了相應的注意力模組，即意圖增強，旨在提取最相關的信息，並在用戶輸入和模型的語言模式之間建立更強的關聯，可以被看作是一個從使用者表達習慣到模型表達習慣的最佳化轉換器。

首先透過特定的提示詞提前獲得LLMs的問題類型，然後重構提問的方式。

首個模擬人類認知的思考架構OlaGPT：六大模組增強語言模型，推理能力最高提升85%

例如在問題的開頭加上一句「Now give you the XX（問題類型），question and choices:」；為了方便分析，提示中還需要加入「 The answer must end with JSON format: Answer: one of options[A,B,C,D,E].”

首個模擬人類認知的思考架構OlaGPT：六大模組增強語言模型，推理能力最高提升85%

##記憶（Memory）

記憶模組在儲存各種知識庫資訊方面起著至關重要的作用，已經有研究證明了當下語言模型在理解最新事實數據方面的局限性，而記憶模組著重於鞏固模型尚未內化的知識，並將其作為長期記憶儲存在外部庫中。

研究人員利用langchain的記憶功能進行短期記憶，然後使用基於Faiss的向量資料庫來實現長期記憶。

在查詢過程中，其檢索功能可以從庫中提取相關知識，涵蓋了四種類型的記憶庫：事實、工具、筆記和思維（thinking），其中事實是現實世界的信息，如常識等；工具包括搜尋引擎、計算器和維基百科，可以協助語言模型完成一些無需為條的工作；筆記主要記錄一些疑難案例和解決問題的步驟；思考庫主要儲存由專家編寫的人類解決問題的思考模板，專家可以是人類，也可以是模型。

學習（Learning）

學習的能力對於人類不斷提升自我表現至關重要，從本質上講，所有形式的學習都依賴經驗，語言模型可以從之前的錯誤中學習，從而實現快速提高推理能力。

首個模擬人類認知的思考架構OlaGPT：六大模組增強語言模型，推理能力最高提升85%

首先，研究人員找出語言模型無法解決的問題；然後在筆記庫中記錄專家提供的見解和解釋；最後選擇相關的筆記來促進語言模型的學習，從而可以更有效地處理類似問題。

推理（Reasoning）

推理模組的目的是創建基於人類推理過程的多個智能體，從而激發語言模型的潛在思考能力，進而解決推理問題。

首個模擬人類認知的思考架構OlaGPT：六大模組增強語言模型，推理能力最高提升85%

該模組結合了多種思維模板，參考特定的思維類型，如橫向思維、順序思維、批判性思維和整合性思維，以促進推理任務。

控制器（Controller）

控制器模組主要用來處理相關的行動選擇，具體包括模型的內部規劃任務（如選擇某些模組來執行）以及從事實、工具、筆記和思維庫中選擇。

首個模擬人類認知的思考架構OlaGPT：六大模組增強語言模型，推理能力最高提升85%

首先檢索和匹配相關的庫，檢索到的內容隨後被整合到一個模板智能體中，要求語言模型以異步的方式在一個模板下提供回复，就像人類在推理之初可能難以辨識所有的相關資訊一樣，同樣很難期望語言模型一開始就做到這一點。

因此，動態檢索是根據使用者的問題和中間的推理進度來實現的，使用Faiss方法為上述四個庫建立嵌入索引，其中各個庫的檢索策略略有不同。

投票（voting）

由於不同的思維模板可能更適合不同類型的問題，研究人員設計了投票模組來提升多個思維模板之間的整合校準能力，並多種投票策略來產生最佳答案以提高效能。

具體的投票方法包括：

1. 語言模型投票：引導語言模型在多個給定的選項中選擇最一致的答案，並提供一個理由。

2. regex投票：用正規表示式精確比對抽取答案以獲得投票結果。

實驗結果

為了評估此增強型語言模型框架在推理任務中的有效性，研究人員在兩類推理資料集上進行了全面的實驗比較。

首個模擬人類認知的思考架構OlaGPT：六大模組增強語言模型，推理能力最高提升85%

從結果可以看出：

1. SC（self-consistency）的性能優於GPT-3.5-turbo，表明在一定程度上採用集成方法確實有助於提高大規模模型的有效性。

2. 文中提出方法的表現超過了SC，在一定程度上證明了思考模板策略的有效性。

不同思維模板的答案表現出相當大的差異，在不同的思維模板下進行投票，最終會比簡單地進行多輪投票產生更好的結果。

3. 不同思考模板的效果是不同的，循序漸進的解決方案可能更適合推理型問題。

4. 主動學習模組的表現明顯優於零樣本方法。

把具有挑戰性的案例當作筆記庫的一部分，利用隨機、檢索和組合清單可以提高效能，這是一種可行的策略。

5. 不同的檢索方案在不同的資料集上有不同的效果，總的來說，組合（combine）策略的效果更好。

6. 文中方法明顯優於其他方案，這得益於整體框架的合理設計，包括主動學習模組的有效設計；思維模板實現了對不同模型的適應，不同思維模板下的結果是不同的；控制器模組起到了很好的控製作用，選擇了與所需內容比較匹配的內容；投票模組設計的不同思維模板的集成方式是有效的。

參考資料：

https://www.php.cn/link/73a1c863a54653d5e184b790fee14754

以上是首個模擬人類認知的思考架構OlaGPT：六大模組增強語言模型，推理能力最高提升85%的詳細內容。更多資訊請關注PHP中文網其他相關文章！

本網站聲明

本文內容由網友自願投稿，版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容，請聯絡admin@php.cn

熱AI工具

熱工具

熱門話題

gmail信箱登陸入口在哪裡

7504

CakePHP 教程

1378

steam的賬戶名稱是什麼格式

win11激活密鑰永久

NYT連接提示和答案

Related knowledge

全球最強開源 MoE 模型來了，中文能力比肩 GPT-4，價格僅 GPT-4-Turbo 的近百分之一 May 07, 2024 pm 04:13 PM

想像一下，一個人工智慧模型，不僅擁有超越傳統運算的能力，還能以更低的成本實現更有效率的效能。這不是科幻，DeepSeek-V2[1]，全球最強開源MoE模型來了。 DeepSeek-V2是一個強大的專家混合（MoE）語言模型，具有訓練經濟、推理高效的特點。它由236B個參數組成，其中21B個參數用於啟動每個標記。與DeepSeek67B相比，DeepSeek-V2效能更強，同時節省了42.5%的訓練成本，減少了93.3%的KV緩存，最大生成吞吐量提高到5.76倍。 DeepSeek是一家探索通用人工智

AI顛覆數學研究！菲爾茲獎得主、華裔數學家領銜11篇頂刊論文｜陶哲軒轉贊 Apr 09, 2024 am 11:52 AM

AI，的確正在改變數學。最近，一直十分關注這個議題的陶哲軒，轉發了最近一期的《美國數學學會通報》（BulletinoftheAmericanMathematicalSociety）。圍繞著「機器會改變數學嗎？」這個話題，許多數學家發表了自己的觀點，全程火花四射，內容硬核，精彩紛呈。作者陣容強大，包括菲爾茲獎得主AkshayVenkatesh、華裔數學家鄭樂雋、紐大電腦科學家ErnestDavis等多位業界知名學者。 AI的世界已經發生了天翻地覆的變化，要知道，其中許多文章是在一年前提交的，而在這一

替代MLP的KAN，被開源專案擴展到卷積了 Jun 01, 2024 pm 10:03 PM

本月初，來自MIT等機構的研究者提出了一種非常有潛力的MLP替代方法—KAN。 KAN在準確性和可解釋性方面表現優於MLP。而且它能以非常少的參數量勝過以更大參數量運行的MLP。例如，作者表示，他們用KAN以更小的網路和更高的自動化程度重現了DeepMind的結果。具體來說，DeepMind的MLP有大約300,000個參數，而KAN只有約200個參數。 KAN與MLP一樣具有強大的數學基礎，MLP基於通用逼近定理，而KAN基於Kolmogorov-Arnold表示定理。如下圖所示，KAN在邊上具

你好，電動Atlas！波士頓動力機器人復活，180度詭異動作嚇到馬斯克 Apr 18, 2024 pm 07:58 PM

波士頓動力Atlas，正式進入電動機器人時代！昨天，液壓Atlas剛「含淚」退出歷史舞台，今天波士頓動力就宣布：電動Atlas上崗。看來，在商用人形機器人領域，波士頓動力是下定決心要跟特斯拉硬剛一把了。新影片放出後，短短十幾小時內，就已經有一百多萬觀看。舊人離去，新角色登場，這是歷史的必然。毫無疑問，今年是人形機器人的爆發年。網友銳評：機器人的進步，讓今年看起來像人類的開幕式動作、自由度遠超人類，但這真不是恐怖片？影片一開始，Atlas平靜地躺在地上，看起來應該是仰面朝天。接下來，讓人驚掉下巴

Google狂喜：JAX性能超越Pytorch、TensorFlow！或成GPU推理訓練最快選擇 Apr 01, 2024 pm 07:46 PM

谷歌力推的JAX在最近的基準測試中表現已經超過Pytorch和TensorFlow，7項指標排名第一。而且測試並不是JAX性能表現最好的TPU上完成的。雖然現在在開發者中，Pytorch依然比Tensorflow更受歡迎。但未來，也許有更多的大型模型會基於JAX平台進行訓練和運行。模型最近，Keras團隊為三個後端（TensorFlow、JAX、PyTorch）與原生PyTorch實作以及搭配TensorFlow的Keras2進行了基準測試。首先，他們為生成式和非生成式人工智慧任務選擇了一組主流

FisheyeDetNet：首個以魚眼相機為基礎的目標偵測演算法 Apr 26, 2024 am 11:37 AM

目標偵測在自動駕駛系統當中是一個比較成熟的問題，其中行人偵測是最早得以部署演算法之一。在多數論文當中已經進行了非常全面的研究。然而，利用魚眼相機進行環視的距離感知相對來說研究較少。由於徑向畸變大，標準的邊界框表示在魚眼相機當中很難實施。為了緩解上述描述，我們探索了擴展邊界框、橢圓、通用多邊形設計為極座標/角度表示，並定義一個實例分割mIOU度量來分析這些表示。所提出的具有多邊形形狀的模型fisheyeDetNet優於其他模型，並同時在用於自動駕駛的Valeo魚眼相機資料集上實現了49.5%的mAP

特斯拉機器人進廠打工，馬斯克：手的自由度今年將達到22個！ May 06, 2024 pm 04:13 PM

特斯拉機器人Optimus最新影片出爐，已經可以在工廠裡打工了。正常速度下，它分揀電池（特斯拉的4680電池）是這樣的：官方還放出了20倍速下的樣子——在小小的「工位」上，揀啊揀啊揀：這次放出的影片亮點之一在於Optimus在廠子裡完成這項工作，是完全自主的，全程沒有人為的干預。而且在Optimus的視角之下，它還可以把放歪了的電池重新撿起來放置，主打一個自動糾錯：對於Optimus的手，英偉達科學家JimFan給出了高度的評價：Optimus的手是全球五指機器人裡最靈巧的之一。它的手不僅有觸覺

單卡跑Llama 70B快過雙卡，微軟硬生把FP6搞到A100哩 | 開源 Apr 29, 2024 pm 04:55 PM

FP8和更低的浮點數量化精度，不再是H100的「專利」了！老黃想讓大家用INT8/INT4，微軟DeepSpeed團隊在沒有英偉達官方支援的條件下，硬生在A100上跑起FP6。測試結果表明，新方法TC-FPx在A100上的FP6量化，速度接近甚至偶爾超過INT4，而且比後者擁有更高的精度。在此基礎之上，還有端到端的大模型支持，目前已經開源並整合到了DeepSpeed等深度學習推理框架中。這項成果對大模型的加速效果也是立竿見影──在這種框架下用單卡跑Llama，吞吐量比雙卡還要高2.65倍。一名

See all articles

首個模擬人類認知的思考架構OlaGPT：六大模組增強語言模型，推理能力最高提升85%

模擬人類的認知

OlaGPT

意圖增強（Intention Enhance）

熱AI工具

Undresser.AI Undress

AI Clothes Remover

Undress AI Tool

Clothoff.io

AI Hentai Generator

熱門文章

熱工具

記事本++7.3.1

SublimeText3漢化版

禪工作室 13.0.1

Dreamweaver CS6

SublimeText3 Mac版

熱門話題