首頁 科技週邊 人工智慧 讓機器擬人化,從'人工智障”到'人工智慧”

讓機器擬人化,從'人工智障”到'人工智慧”

Jun 03, 2023 am 11:34 AM
人工智慧 人工智障 機器擬人化

5月27日,創業黑馬在北京舉辦 「2023躍遷•黑馬AIGC高峰會」。此次大會的主題為「預見新世界,建構新格局」。有「AI專家」之稱的卡內基美隆大學計算機學院前副院長、達沃斯世界經濟論壇(WEF)計算機全球未來理事會前主席賈斯汀•卡塞爾,以及360集團、智源研究院、崑崙萬維、雲知聲、藍色遊標、萬興科技、知道創宇等眾多行業內企業高層到場,與上千位與會者進行了深入交流。

在高峰會現場,雲知聲創辦人、CEO 黃偉分享了 《通往智享未來之路》主題。

以下為分享內容整理:

開始我們希望按照專家的方式去做,希望交給機器一些方法論,十年前,機器開始從錯誤回饋學習。這都是在過去人工智慧技術裡的大概階段和路徑。

今天OpenAI推出了ChatGPT和預訓練模型,整個智能變得更加擬人化,首先我們用非常強大的算力閱讀了全世界已知的所有文本,訓練形成了大模型。它特別像嬰兒大腦,可能有幾百億、上千億的參數,和人腦不同的是,嬰兒最多只是遺傳了父母的外表和性格等,但大模型的大腦遺傳了知識,這只是初始狀態,接下來會透過微調等各種方式,像小孩在成長過程中會有各種教育,整個大模型的演進更加擬人化。

這是整個人工智慧的變化。

今天的AGI和之前有什麼本質變化? 2022年12月份之前,整個人工智慧還是一種鑑別式人工智慧,做判斷題、專用系統和智慧模組,做一些特定任務。一方面人工智慧的表現並不是那麼智能,常被別人詬病“你們提供的是人工智障”,以至於過去人工智慧的能力天花板較低。

第二,在很多場景裡,客戶的需求是千差萬別的,但人工智慧的能力沒那麼強,很多公司和團隊用各種客製化去滿足。人工智慧企業不像高科技公司,在過去十年裡,只能做鑑別式AI是手工作坊的時代。但現在有了大模型,有更強大的通用能力,人工智慧開始進入工業化時代。

有了新的生成能力、湧現能力,用一個模型就能解決許多場景下的不同問題。今天這個時代,人工智慧大模型就是發電機,在引擎還沒發明之前,中東國家並沒有那麼富裕,石油的價值沒那麼大。就像今天可以把數據變成燃料和能力,用這個能力賦能千行百業。

雲知聲為什麼能夠在短時間推出自研大模型?

2016年看到AlphaGo,我們把醫療產品在醫院裡落地,幫助北京協和醫院的醫生,大大提高工作效率。在醫院這個場景裡,只是效率工具是不夠的,人工智慧真正的智能是認知智能,Transformer是2017年提出來的,認知智能的背後需要比較強大的算力。

有了這些鋪墊,無論從學術或工程化方面,累積了許多經驗。這個經驗對於個人來講是你謀生的能力,但對公司來說是在市場上勝出的核心競爭力。把ChatGPT框架看了之後,發現沒有一項是新的,都是一些已有的工程化組合,我們很快就把這種能力結合,投入大模型研發。

讓機器擬人化,從人工智障”到人工智慧”

我們在三天前,發布了商業大模型,名字叫山海。把預訓練、指令微調、基於人類回饋的增強學習全部跑通,看到了期待已久的湧現能力。那時候團隊就在想是不是要給它取個名字,那段時間我在頻繁出差,覺得名字還挺好的。海是波瀾壯闊,有容乃大,體現出大模型的無限生成能力,山是高山仰止,我們知道什麼能說、什麼不能說,這恰恰是既要強調大模型的生成能力,又要強調大模型的安全合規問題。

有一個很有趣的現象,大家都在談大模型,國內對大模型的關注是在春節後,但大家都不談這個事,心裡都沒底。到今天為止,有一種觀點這件事情只有技術還不能做,哪怕人都到位了,但訓練成本很大,是極其燒錢的。大模型不是科學革命、不是發明了新的演算法,是把已有的演算法組合在一起做大,大都是有代價的,當然還有很多工程在裡面。觀點是對的。

反过来讲,如果认为未来10-20年大模型是很大的机会,BAT投不进去了,就放弃了,我认为还是有机会的。

云知声在过去的几年里,并不需要特别牛的科学家,我甚至认为这个事就不是科学家干的事情,科学家没有玩过那么多算力,也不知道场景在哪里,所以结果一定是不好的。有场景的厂商反而是最有可能成功的。

起山海这个名字,还有一个意思,所爱隔山海,山海皆可平。

山海之力是十项全能。生成能力是非常主观的,真正在场景落地的时候,语言理解能力很重要,为什么以前觉得是人工智障,因为缺乏理解和代码能力。代码能力的提升能够有助提升大模型的推理能力,输出结果一定要符合国内的法律法规甚至道德价值观等。我们还采用GPT-4 插件的架构,帮助企业和客户,从数据的优选、模型训练、模型部署等一条龙服务。

为什么大模型具备复杂的逻辑推理能力?我们今天做到了,但不知道为什么,到底是500亿参数还是1000亿参数更好,却不好说,可能1000亿参数里面神经元还没有被激活。

另外还有医疗,一开始我们在做大模型,很多人以为云知声做的是垂直行业模型,并不是,我们是做行业应用。挑战了一个最严肃的场景——医疗,通过预训练阶段,收集了很多医学的文献、专著、书籍,病案,积累了几千万真实标注的数据,这些数据可以转化成我们的微调数据。

另外在2019年还获得了北京市科技进步一等奖,获奖项目就是大规模知识图谱构建关键技术及应用,我们有国内最大规模之一的医疗知识图谱,我们把知识图谱分解成知识插件嵌入到大语言模型中,使得大模型变成医疗领域的专家。

MedQA是一个非常权威的医疗知识问答测试集,包括谷歌的Med-PaLM,ChatGPT和GPT-4都在这个测试集上公布了它们的评测结果,山海前不久的评测中做到了81分,大大超过了GPT-4的71分。通过领域增强以后,能够把大模型变成某个领域的专家。还有一个数字可以做横向对比,医学院毕业生要通过临床执业医师考试目前已知的AI最高分数是456分,山海大概考了511分,这就是大模型通过领域增强以后获得的超强能力。

想做大模型还是挺难的,门槛非常高,除了需要很多钱之外、优秀的算法工程师和算法之外,还需要很多能力,我们把它总结为山海之功。直观来讲,大模型本身就是大数据集,大模型是工程师的活儿,云知声为什么能够用几个月的时间就能做出一个非常权威的客观的评测数据,我们内部去评,不只在医疗,在通用领域方面,云知声都是最好之一。

算力平台不是买多少卡来插就行了,云知声差不多有200P算力,利用集群的效率达到业内最顶尖的水平,可以用相对比较少的卡,很快速地训练出我们的模型。

我们目前GPU集群的利用率能做到50%,大模型需要多卡,目前业内的水平大概是42%。大模型还要做到3D混合并行训练。什么是3D?就是模型的并行化、数据的并行化、流水线的并行化,要把任务分离到很多不同机器的不同卡里分别计算,最后能快速得到响应的结果。另外在模型推理里得到了很多优化,推理的速度提高了5倍,怎么样把训练卡和推理卡分开,训练卡是A800,推理卡是在一张单卡A6000上就可以实现快速推理。

另外数据很重要,数据规模、数据多样性、数据高质量,我们现在能做到支持10T级别的快速去重,ChatGPT的训练数去是45T,但是优选之后用了几百G的数据来训练。

有了这些能力之后,就能够基于Atlas和UniDataOps的能力,可以把山海的能力和行业客户更好地提供服务。

智慧物联也是公司的一块重要业务,我们有很多落地,过去用的效果确实不太好,希望有了山海之后,用大模型把已有的物联网的产品全部做一遍。

醫療是我們看好的方向。 以前的醫療方向,產品主要有兩個方面,一是不用手敲鍵盤,直接拿麥克風說話,極大提升了醫生的工作效率,把病歷輸入時間從3個小時縮短到了1個小時;二是有了病歷之後,還有一套系統,透過AI大腦審核病歷,審核病歷有沒有錯誤,現在有了AI大模型能力之後能夠做什麼呢?

山海的願景是透過人工智慧打造互聯、直覺的世界,而以前對人工智慧的定義是讓機器服從人,今天希望機器更擬人。人和物的溝通交流會變的更直觀,新的能力會帶來新的產品、新的商業模式,非常願意和在座各位共同迎接大模型的新時代。

掃碼加入黑馬創業者交流群組

#↓↓↓

#掃描下方二維碼

#加入黑馬AIGC產業營

讀懂AIGC底層邏輯,一步連結產業未來

#↓↓↓

#分享、讚和在看,完成三連擊,把好的內容傳遞給更多需要的人。

更多精彩內容,盡在i黑馬影片號碼

#↓↓↓

#關注黑馬傳播矩陣,get更多精彩內容

↓↓ ↓

#

以上是讓機器擬人化,從'人工智障”到'人工智慧”的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1662
14
CakePHP 教程
1419
52
Laravel 教程
1312
25
PHP教程
1262
29
C# 教程
1235
24
位元組跳動剪映推出 SVIP 超級會員:連續包年 499 元,提供多種 AI 功能 位元組跳動剪映推出 SVIP 超級會員:連續包年 499 元,提供多種 AI 功能 Jun 28, 2024 am 03:51 AM

本站6月27日訊息,剪映是由位元組跳動旗下臉萌科技開發的一款影片剪輯軟體,依託於抖音平台且基本面向該平台用戶製作短影片內容,並相容於iOS、安卓、Windows 、MacOS等作業系統。剪映官方宣布會員體系升級,推出全新SVIP,包含多種AI黑科技,例如智慧翻譯、智慧劃重點、智慧包裝、數位人合成等。價格方面,剪映SVIP月費79元,年費599元(本站註:折合每月49.9元),連續包月則為59元每月,連續包年為499元每年(折合每月41.6元) 。此外,剪映官方也表示,為提升用戶體驗,向已訂閱了原版VIP

使用Rag和Sem-Rag提供上下文增強AI編碼助手 使用Rag和Sem-Rag提供上下文增強AI編碼助手 Jun 10, 2024 am 11:08 AM

透過將檢索增強生成和語意記憶納入AI編碼助手,提升開發人員的生產力、效率和準確性。譯自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。雖然基本AI程式設計助理自然有幫助,但由於依賴對軟體語言和編寫軟體最常見模式的整體理解,因此常常無法提供最相關和正確的程式碼建議。這些編碼助手產生的代碼適合解決他們負責解決的問題,但通常不符合各個團隊的編碼標準、慣例和風格。這通常會導致需要修改或完善其建議,以便將程式碼接受到應

七個很酷的GenAI & LLM技術性面試問題 七個很酷的GenAI & LLM技術性面試問題 Jun 07, 2024 am 10:06 AM

想了解更多AIGC的內容,請造訪:51CTOAI.x社群https://www.51cto.com/aigc/譯者|晶顏審校|重樓不同於網路上隨處可見的傳統問題庫,這些問題需要跳脫常規思維。大語言模型(LLM)在數據科學、生成式人工智慧(GenAI)和人工智慧領域越來越重要。這些複雜的演算法提升了人類的技能,並在許多產業中推動了效率和創新性的提升,成為企業保持競爭力的關鍵。 LLM的應用範圍非常廣泛,它可以用於自然語言處理、文字生成、語音辨識和推薦系統等領域。透過學習大量的數據,LLM能夠產生文本

微調真的能讓LLM學到新東西嗎:引入新知識可能讓模型產生更多的幻覺 微調真的能讓LLM學到新東西嗎:引入新知識可能讓模型產生更多的幻覺 Jun 11, 2024 pm 03:57 PM

大型語言模型(LLM)是在龐大的文字資料庫上訓練的,在那裡它們獲得了大量的實際知識。這些知識嵌入到它們的參數中,然後可以在需要時使用。這些模型的知識在訓練結束時被「具體化」。在預訓練結束時,模型實際上停止學習。對模型進行對齊或進行指令調優,讓模型學習如何充分利用這些知識,以及如何更自然地回應使用者的問題。但是有時模型知識是不夠的,儘管模型可以透過RAG存取外部內容,但透過微調使用模型適應新的領域被認為是有益的。這種微調是使用人工標註者或其他llm創建的輸入進行的,模型會遇到額外的實際知識並將其整合

你所不知道的機器學習五大學派 你所不知道的機器學習五大學派 Jun 05, 2024 pm 08:51 PM

機器學習是人工智慧的重要分支,它賦予電腦從數據中學習的能力,並能夠在無需明確編程的情況下改進自身能力。機器學習在各個領域都有廣泛的應用,從影像辨識和自然語言處理到推薦系統和詐欺偵測,它正在改變我們的生活方式。機器學習領域存在著多種不同的方法和理論,其中最具影響力的五種方法被稱為「機器學習五大派」。這五大派分別為符號派、聯結派、進化派、貝葉斯派和類推學派。 1.符號學派符號學(Symbolism),又稱符號主義,強調利用符號進行邏輯推理和表達知識。該學派認為學習是一種逆向演繹的過程,透過現有的

為大模型提供全新科學複雜問答基準與評估體系,UNSW、阿貢、芝加哥大學等多家機構共同推出SciQAG框架 為大模型提供全新科學複雜問答基準與評估體系,UNSW、阿貢、芝加哥大學等多家機構共同推出SciQAG框架 Jul 25, 2024 am 06:42 AM

編輯|ScienceAI問答(QA)資料集在推動自然語言處理(NLP)研究中發揮著至關重要的作用。高品質QA資料集不僅可以用於微調模型,也可以有效評估大語言模型(LLM)的能力,尤其是針對科學知識的理解和推理能力。儘管目前已有許多科學QA數據集,涵蓋了醫學、化學、生物等領域,但這些數據集仍有一些不足之處。其一,資料形式較為單一,大多數為多項選擇題(multiple-choicequestions),它們易於進行評估,但限制了模型的答案選擇範圍,無法充分測試模型的科學問題解答能力。相比之下,開放式問答

SOTA性能,廈大多模態蛋白質-配體親和力預測AI方法,首次結合分子表面訊息 SOTA性能,廈大多模態蛋白質-配體親和力預測AI方法,首次結合分子表面訊息 Jul 17, 2024 pm 06:37 PM

編輯|KX在藥物研發領域,準確有效地預測蛋白質與配體的結合親和力對於藥物篩選和優化至關重要。然而,目前的研究並沒有考慮到分子表面訊息在蛋白質-配體相互作用中的重要作用。基於此,來自廈門大學的研究人員提出了一種新穎的多模態特徵提取(MFE)框架,該框架首次結合了蛋白質表面、3D結構和序列的信息,並使用交叉注意機制進行不同模態之間的特徵對齊。實驗結果表明,該方法在預測蛋白質-配體結合親和力方面取得了最先進的性能。此外,消融研究證明了該框架內蛋白質表面資訊和多模態特徵對齊的有效性和必要性。相關研究以「S

SK 海力士 8 月 6 日將展示 AI 相關新品:12 層 HBM3E、321-high NAND 等 SK 海力士 8 月 6 日將展示 AI 相關新品:12 層 HBM3E、321-high NAND 等 Aug 01, 2024 pm 09:40 PM

本站8月1日消息,SK海力士今天(8月1日)發布博文,宣布將出席8月6日至8日,在美國加州聖克拉拉舉行的全球半導體記憶體峰會FMS2024,展示諸多新一代產品。未來記憶體和儲存高峰會(FutureMemoryandStorage)簡介前身是主要面向NAND供應商的快閃記憶體高峰會(FlashMemorySummit),在人工智慧技術日益受到關注的背景下,今年重新命名為未來記憶體和儲存高峰會(FutureMemoryandStorage),以邀請DRAM和儲存供應商等更多參與者。新產品SK海力士去年在

See all articles