9月8日下午,中國工程院院士、清華大學計算機系教授、海致科技首席科學家鄭緯民在北京演示發布了由海致科技與高性能圖計算院士工作站共同開發的“Atlas LLM 知識圖譜與大模型融合應用平台」,該平檯面向廣大B端用戶,運用知識圖譜這項人工智慧基礎技術,幫助大模型在企業級和工業界應用中克服“幻覺”,實現基於行業與場景的精準推演
該產品目前已在能源、金融、政務等領域的場景中進行部署和應用,力圖打通通用人工智慧進入B 端和工業應用的「最後一公里」。
中國電子技術標準化研究院、全國信標委等單位發起了一項名為《知識圖譜與大模型融合實踐報告》的活動,海緻科技全程參與其中。該報告已經正式發布,並將分享上述成果以及一些應用案例,以促進更多市場主體和技術力量參與通用人工智慧的多技術融合
「當大模型從C 端走向B 端,它就像從玩具走向工具,而工具的精確性至關重要。寫文章時查詢愛因斯坦提出相對論的時間錯了不太要緊,但是如果大模型對電網故障的維修提出了錯誤的選項,結果可能是一場災難」海致科技首席科學家鄭緯民院士在接受記者採訪時表示:” 短期來看,單純依靠大模型自身的迭代,'幻覺'問題難以解決,在這方面,知識圖譜作為更加類腦的人工智能工具,其精確的知識推導能力就可以跟大模型構成非常好的相互補充,反過來,大模型的快速學習能力,對於知識圖譜的知識生成也產生了很好的促進。「
#大語言模型(LLM)的通用性、快速自主學習和自我改進的能力被認為是革命性的,並且已經被廣泛認可。然而,由於LLM的基本運作方式是分析文本中的詞彙、句法結構和語義訊息,並捕捉它們之間的模式和機率分佈,因此它更傾向於基於統計規律生成回答,而不是進行深入的邏輯推理或形成高階的認知能力。此外,在生成文字時,LLM可能會受到訓練資料中存在的偏見和誤導性資訊的限制,在某些情況下可能會產生不準確或不合理的答案。這種基於技術特徵產生的缺陷被形象化地比喻為「大模型幻覺」。這種意外的「幻覺」正是通用人工智慧,尤其是以大模型為代表的通用人工智慧進入嚴謹B端應用面臨的最後,也是最大的挑戰
#在這一背景下,另一種廣泛應用的人工智慧基礎技術— 知識圖譜,開始展現出它與大模型天然的互補能力。知識圖譜作為公認 「類腦」 的知識表達方式,透過對語意網路進行建模,以結構化的形式描述客觀世界中實體及關係,被廣泛應用於知識推理。基於知識圖譜的知識推理在離散符號表示的基礎上,透過推理路徑、邏輯規則等輔助手段,對推理過程進行解釋,為實現 「可解釋人工智慧」 提供了重要途徑。
由鄭緯民院士擔任首席科學家的海緻科技,創業已有十年歷程,是國內目前規模最大、應用客戶範圍最廣的知識圖譜和圖計算公司。在金融、政務、能源、交通等領域擁有豐富且廣闊的知識圖譜應用經驗,並推出了全球領先的國產分散式雲端原生圖資料庫Atlas Graph,作為中國資料庫代表入選Gartner《全球圖資料庫管理系統市場指南》,填補了國產分散式圖資料庫的空白。
2022年10月,鄭緯民院士帶領年輕科學家在海致科技設立了"高效圖計算院士工作站",開始追蹤全球各種大模型研發動態。他們致力於將知識圖譜與大模型技術深度結合,並在金融、能源、政務企事業單位進行部署試用。他們瞄準B端產業客戶長期累積的龐大結構化資料體系和運算分析應用體系,鄭院士與海緻創新地將知識圖譜作為中介橋樑,連結既有資料體系與大模型,全面提升大模型在產業落地的可解釋性、可互動性和可驗證性
"人工智慧發展的一個衡量標準是對人腦智能的學習。據我們觀察,知識圖譜的嚴密推理類似於人類的左腦,而大型模型的快速學習則與右腦的靈活相似。"鄭緯民表示:「我們的產品旨在透過一套知識映射、校驗和優化的架構,實現左右腦之間的互通,推動通用人工智慧在企業級場景中的深入應用。」
海致科技的首席技術長楊娟發布了關於知識圖譜和大模型應用產品的訊息
「我們不生產大模型,我們致力於將大模型應用於生產。」 海致科技CTO 楊娟博士介紹說,海致Atlas LLM 大模型融合應用平台有三個非常獨特的定位:一是在全過程實現了知識圖譜與大模型的交互,有效克服大模型幻覺對工業應用的干擾;二是更好管理了客戶已有的豐富的數據資產,將其與大模型成果統一整理,避免重複造輪子,使得運算更有效率,應用更精確;三是能夠幫助顧客切換和靈活應用不同的開源大模型,實現更高性價比的場景應用。
海致科技高級副總裁瞿珂為我們列舉了該上述平台已經驗證的一個工業場景:在工業製造設備運檢領域中,複雜生產系統的故障識別因其故障組合類型複雜、數據異構、以及要求反應速度很快,一直是人們對人工智能寄予厚望的領域。 「過去我們透過利用知識圖譜技術,可以將設備間關係以及關聯設備量測訊號建構成故障知識特徵子圖來幫助機器自動實現故障識別,但是這個過程需要業務專家配合技術人員進行大量的實體構建和配置工作為先決條件,才能實現知識生成。但是今天我們可以透過大模型極大地提高這一知識抽取和融合的過程效率,一方面,透過大模型對故障設備及關聯量測值的快速提取,幫助知識圖譜完成特徵圖的快速構建,提高效率;另一方面,也可以透過業務專家對大模型自動產生的特徵圖進行更為高效的校驗,固化和校準故障特徵的經驗知識,確保品質。 ”
在大模型時代,產業企業客戶關心的另一個重點是,未來的發展是要完全推翻舊的運算分析體系,還是基於既有的計算分析體系進行一次升級?海致科技基於客戶已建立的龐大計算分析應用和業務小模型,按照“基礎場景識別綜合場景編排場景固化發布”的邏輯,實現了大模型應用的“三步走”
第一步:將客戶已有運算分析和業務小模型的基礎場景服務透過大模型微調,對場景語意進行標註識別,並形成基礎服務場景庫。
重寫內容如下:第二步:透過綜合應用高階場景和對應的Prompt語義,利用大模型推理能力,聰明地編排計算呼叫和計算邏輯
重寫後的內容:在第三步驟中,我們將透過大模型編排來產生場景編排知識圖譜。透過利用知識圖譜的可觀測解釋性和可交互操作性,我們可以對複雜場景的大模型編排結果進行觀測和人工校驗調優。這樣可以實現對應語義的場景知識的穩定固化,並具備對外發布的能力
目前,海致已經實現了基於行業客戶已有計算分析多能力的基礎場景識別,複雜場景編排和基於知識圖譜的知識可觀測、固化校驗及發布能力,使大模型能夠在已有計算分析知識和圖譜固化場景兩個「準確性控制」 下,達成以大模型推理生成為核心的精準計算問答。
以上是海致科技發表首個知識圖譜融合大模型應用平台,協助國內百模大戰的詳細內容。更多資訊請關注PHP中文網其他相關文章!