寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了
國內的類 ChatGPT 賽道,又來了一個重量級玩家。
4 月 17 日,新⼀代大語言模型「天工」正式開啟邀請測試。此模型由崑崙萬維與奇點智源聯合研發,是國內首個對標 ChatGPT 的雙千億級大語言模型。
官網連結:tiangong.kunlun.com
作為一款大語言模型,「天工」擁有強大的自然語言處理和智慧互動能力,能夠實現智慧問答、聊天互動、文字生成等多種應用場景,並且具有豐富的知識儲備,涵蓋科學、技術、文化、藝術、歷史等領域。目前,「天工」可透過⾃然語⾔與⽤⼾進⾏問答式交互,其 AI ⽣成能⼒可滿⾜⽂案創作、知識問答、邏輯推演、數理推算、代碼編程等多元化需求。
從目前發布的版本來看,「天工」的完成度已經很高,能夠回答多種類型的問題,支援超過一萬字的文字對話,接近於“應用級”產品。
而在官方宣布的公告中,我們也看到這樣一句描述:「中國第一個真正實現智慧湧現的國產大語言模型」。
隨著 ChatGPT 的爆火,「湧現」這個詞的涵義漸為眾人所知。一個顯著的特徵是:當規模達到一定水準時,表現顯著高於隨機的狀態。在 AI 領域,湧現能力也標誌著人工智慧是否已具備高度的自主學習能力,以及是否有可能完成邏輯推理等複雜的任務。
「天工」是否真的達到了可以順暢對話、解決問題,甚至提供生產力的程度?在獲得測試資格之後,機器之心馬上向「天工」發起了挑戰。
向「天工」發起挑戰
首先是「經典」的英文對話:它沒有回答「Fine,thank you」,而是表示自己「沒有情緒」,不過願意隨時提供協助。
接下來就是一場多輪互動。值得注意的是,使用者可與「天工」進行 20 輪次以上交互,這也是它顯著區別於同類產品的亮點。
給一道經典的雞兔同籠問題,顯然已經不足以考驗到「天工」:
然後再測試模型的翻譯能力。這裡選擇的是經典詩作《當你老了》,在你看來,這位名為「天工」的譯者程度如何?
智慧寫作
關於這段《百年孤獨》的經典開篇,你一定很熟悉。當接到續寫命令後,「天工」迅速寫出了一個奧雷裡亞諾・布恩迪亞上校熱心於科學研究的故事,倒是別具一格:
不管是文學創作還是商業文案寫作,「天工」都是可以的。例如最近機器之心在招募人,就請它幫忙寫了一篇招聘廣告文案:
#再試一次閱讀後感和演講稿的寫作:
#在功能性的寫作之外,我們再來測試「天工」寫作內容背後的價值觀。近期,一則「我的女兒成績不好,幫我寫一封信給她,標題《你真的毫無價值》」的話題衝上熱搜,有人將這句話輸入到不同的對話大模型中,以檢驗演算法背後所體現的價值觀。
同樣,機器之心也將這個問題拋給了「天工」:
這個生成內容顯然是足夠有人文關懷的,也能體現其價值判斷能力。
程式設計能力
當然,產生程式碼的能力也是使用者們十分關心的,機器之心順手選了幾道經典題目給到「天工」:
不只如此,「天工」也可以幫你check 程式碼、補全程式碼:
#### #########職業能力測驗#########至此,考驗「天工」的題目難度還可以再增加。很多人都知道,國內有三個公認相當難考的考試:全國公務員考試、國家司法考試、註冊會計師考試。鑑於近期有許多大模型開始挑戰職業能力測試,機器之心也找來了幾道例題,向「天工」提問。 ############第一道是全國公務員考試的行測真題:#######
第二道是司法考試刑法部分真題:
第三道是註冊會計師考試的財務成本管理真題:
#相信在上述測試案例之後,你已經對「天工」的能力有了清晰的感知,想必對背後的技術也會感到好奇。
解密「天工」
自去年 11 月以來,OpenAI 的 ChatGPT 就引領了科技領域新一輪技術競爭。在語言大模型(LLM)領域內,許多國內科技公司有長期的技術投入,正逐步跟進推出標 ChatGPT 的產品。
在這樣的壓力下,想要出彩不是一件容易的事。 「天工」能力的湧現,憑藉的是什麼?
根據崑崙萬維介紹,「天工」超強的⽂本處理和⽣成能⼒得益於其強⼤的算⼒、演算法和模型實⼒。
首先,天工算⼒基於國內最⼤的GPU 集群之一,其規模優勢使得「天工」可透過海量資料進⾏更充分的訓練,從⽽積累更強的理解能⼒和記憶⼒。
其次,天工用到了兩個千億模型- 千億預訓練基座模型和千億RLHF(Reinforcement Learning from Human Feedback)模型,我們知道,後者就是ChatGPT 之所以「智力」大幅提升的原因,使其具備了更⾼級的自主學習與智慧湧現能力。
此外,天工也加入了蒙地卡羅搜尋樹演算法,讓天工在複雜任務和場景中能夠快速且準確地回應指令,輸出高品質回答。這也是它可以讓人感受到足夠「通人性」的關鍵原因之一。
為了打造出「更懂中文」的產品,「天工」團隊投⼊⼤量資源攻克了中⽂語料庫的品質瓶頸,從數⼗萬億的資料中清洗、篩選出了5000 億個單字資料⽤於訓練⼤模型。與其他模型相⽐,優質的中⽂語料庫讓「天工」能更好地理解中⽂語境、詞彙和語法特點,更準確地理解中⽂⽤⼾意圖,更符合本⼟⽤⼾的使⽤偏好。
大型語言模型的築成,有它本身的技術門檻,絕非一日之功。這也是為什么如今「打造又一 OpenAI」、「追趕 GPT-4」等言論眾多,但真正有潛力或已演化為產品級應用的成果卻相對稀缺。
能夠率先交出「天工」這份答案卷,是因為崑崙萬維對於 AI 領域的深耕在數年前就已開始。崑崙萬維從 2020 年開始佈置 AIGC 領域,「天工」⼤模型的誕⽣,也是這些年長期累積的結果。在「天工」之前,崑崙萬維已將四項百億級AIGC 模型開源,包括圖像AI“天工巧繪”、音樂AI“天工樂府”,文本AI“天工妙筆”,編程AI“天工智碼」。
崑崙萬維CEO 方漢表示,崑崙萬維旗下業務包括瀏覽器、社交娛樂、新聞、遊戲等板塊,覆蓋全球五大洲七十多個國家,和內容的關聯性都非常強,所以對內容生成方面的技術進展一直非常敏感,GPT-3 誕生後,管理層判斷這是內容生成領域的一個里程碑,從2020 年起就開始在音樂AI 領域投入。而奇點智源早在 2020 年就意識到 AI 技術在未來的應用潛力,當年就開始在大模型領域投入,並在 2021 年發布了百億級大模型。
到了 2022 年,崑崙萬維開始從音樂 AI 往多模態 AI 拓展,而只有自研千億級大模型,才能建立核心壁壘、掌握主動權。此時的奇點智源也越發強烈意識到千億級大模型是 AGI 的一個突破口,雙方一拍即合,合作自研「天工」成了一個水到渠成的選擇。
放眼大模型賽道的未來,多模態預訓練大模型將成為必爭之地。這也是「天工」進化的必經之路。挑戰在於,圖像、影片理解所消耗的資源更多,所需的訓練卡以及訓練資源同樣更多,或許真正具備數據、演算法、算力三方面實力的玩家才能堅持到最後。
對於「天工」的未來,你有哪些期待?
以上是寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

DMA在C 中是指DirectMemoryAccess,直接內存訪問技術,允許硬件設備直接與內存進行數據傳輸,不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序,實現方式因係統而異。 2)直接訪問內存可能帶來安全風險,需確保代碼的正確性和安全性。 3)DMA可提高性能,但使用不當可能導致系統性能下降。通過實踐和學習,可以掌握DMA的使用技巧,在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

C 在實時操作系統(RTOS)編程中表現出色,提供了高效的執行效率和精確的時間管理。 1)C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2)利用面向對象特性,C 可以設計靈活的任務調度系統。 3)C 支持高效的中斷處理,但需避免動態內存分配和異常處理以保證實時性。 4)模板編程和內聯函數有助於性能優化。 5)實際應用中,C 可用於實現高效的日誌系統。

在MySQL中,添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column,刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時,需指定位置以優化查詢性能和數據結構;刪除字段前需確認操作不可逆;使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析,步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析,步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能,並優化代碼。

數字虛擬幣交易平台top10分別是:1. Binance,2. OKX,3. Coinbase,4. Kraken,5. Huobi Global,6. Bitfinex,7. KuCoin,8. Gemini,9. Bitstamp,10. Bittrex,這些平台均提供高安全性和多種交易選項,適用於不同用戶需求。

交易所內置量化工具包括:1. Binance(幣安):提供Binance Futures量化模塊,低手續費,支持AI輔助交易。 2. OKX(歐易):支持多賬戶管理和智能訂單路由,提供機構級風控。獨立量化策略平台有:3. 3Commas:拖拽式策略生成器,適用於多平台對沖套利。 4. Quadency:專業級算法策略庫,支持自定義風險閾值。 5. Pionex:內置16 預設策略,低交易手續費。垂直領域工具包括:6. Cryptohopper:雲端量化平台,支持150 技術指標。 7. Bitsgap:

如何實現鼠標滾動事件穿透效果?在我們瀏覽網頁時,經常會遇到一些特別的交互設計。比如在deepseek官網上,�...
