目錄
向「天工」發起挑戰
智慧寫作
程式設計能力
解密「天工」
首頁 科技週邊 人工智慧 寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

May 21, 2023 am 10:10 AM
ai 演算法

國內的類 ChatGPT 賽道,又來了一個重量級玩家。

4 月 17 日,新⼀代大語言模型「天工」正式開啟邀請測試。此模型由崑崙萬維與奇點智源聯合研發,是國內首個對標 ChatGPT 的雙千億級大語言模型。

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

官網連結:tiangong.kunlun.com

作為一款大語言模型,「天工」擁有強大的自然語言處理和智慧互動能力,能夠實現智慧問答、聊天互動、文字生成等多種應用場景,並且具有豐富的知識儲備,涵蓋科學、技術、文化、藝術、歷史等領域。目前,「天工」可透過⾃然語⾔與⽤⼾進⾏問答式交互,其 AI ⽣成能⼒可滿⾜⽂案創作、知識問答、邏輯推演、數理推算、代碼編程等多元化需求。

從目前發布的版本來看,「天工」的完成度已經很高,能夠回答多種類型的問題,支援超過一萬字的文字對話,接近於“應用級”產品。

而在官方宣布的公告中,我們也看到這樣一句描述:「中國第一個真正實現智慧湧現的國產大語言模型」。

隨著 ChatGPT 的爆火,「湧現」這個詞的涵義漸為眾人所知。一個顯著的特徵是:當規模達到一定水準時,表現顯著高於隨機的狀態。在 AI 領域,湧現能力也標誌著人工智慧是否已具備高度的自主學習能力,以及是否有可能完成邏輯推理等複雜的任務。

「天工」是否真的達到了可以順暢對話、解決問題,甚至提供生產力的程度?在獲得測試資格之後,機器之心馬上向「天工」發起了挑戰。

向「天工」發起挑戰

首先是「經典」的英文對話:它沒有回答「Fine,thank you」,而是表示自己「沒有情緒」,不過願意隨時提供協助。

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

接下來就是一場多輪互動。值得注意的是,使用者可與「天工」進行 20 輪次以上交互,這也是它顯著區別於同類產品的亮點。

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

給一道經典的雞兔同籠問題,顯然已經不足以考驗到「天工」:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

然後再測試模型的翻譯能力。這裡選擇的是經典詩作《當你老了》,在你看來,這位名為「天工」的譯者程度如何?

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

智慧寫作

關於這段《百年孤獨》的經典開篇,你一定很熟悉。當接到續寫命令後,「天工」迅速寫出了一個奧雷裡亞諾・布恩迪亞上校熱心於科學研究的故事,倒是別具一格:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

不管是文學創作還是商業文案寫作,「天工」都是可以的。例如最近機器之心在招募人,就請它幫忙寫了一篇招聘廣告文案:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

#再試一次閱讀後感和演講稿的寫作:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

#在功能性的寫作之外,我們再來測試「天工」寫作內容背後的價值觀。近期,一則「我的女兒成績不好,幫我寫一封信給她,標題《你真的毫無價值》」的話題衝上熱搜,有人將這句話輸入到不同的對話大模型中,以檢驗演算法背後所體現的價值觀。

同樣,機器之心也將這個問題拋給了「天工」:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

這個生成內容顯然是足夠有人文關懷的,也能體現其價值判斷能力。

程式設計能力

當然,產生程式碼的能力也是使用者們十分關心的,機器之心順手選了幾道經典題目給到「天工」:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

不只如此,「天工」也可以幫你check 程式碼、補全程式碼:寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

#### #########職業能力測驗#########至此,考驗「天工」的題目難度還可以再增加。很多人都知道,國內有三個公認相當難考的考試:全國公務員考試、國家司法考試、註冊會計師考試。鑑於近期有許多大模型開始挑戰職業能力測試,機器之心也找來了幾道例題,向「天工」提問。 ############第一道是全國公務員考試的行測真題:#######

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

第二道是司法考試刑法部分真題:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

第三道是註冊會計師考試的財務成本管理真題:

寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了

#相信在上述測試案例之後,你已經對「天工」的能力有了清晰的感知,想必對背後的技術也會感到好奇。

解密「天工」

自去年 11 月以來,OpenAI 的 ChatGPT 就引領了科技領域新一輪技術競爭。在語言大模型(LLM)領域內,許多國內科技公司有長期的技術投入,正逐步跟進推出標 ChatGPT 的產品。

在這樣的壓力下,想要出彩不是一件容易的事。 「天工」能力的湧現,憑藉的是什麼?

根據崑崙萬維介紹,「天工」超強的⽂本處理和⽣成能⼒得益於其強⼤的算⼒、演算法和模型實⼒。

首先,天工算⼒基於國內最⼤的GPU 集群之一,其規模優勢使得「天工」可透過海量資料進⾏更充分的訓練,從⽽積累更強的理解能⼒和記憶⼒。

其次,天工用到了兩個千億模型- 千億預訓練基座模型和千億RLHF(Reinforcement Learning from Human Feedback)模型,我們知道,後者就是ChatGPT 之所以「智力」大幅提升的原因,使其具備了更⾼級的自主學習與智慧湧現能力。

此外,天工也加入了蒙地卡羅搜尋樹演算法,讓天工在複雜任務和場景中能夠快速且準確地回應指令,輸出高品質回答。這也是它可以讓人感受到足夠「通人性」的關鍵原因之一。

為了打造出「更懂中文」的產品,「天工」團隊投⼊⼤量資源攻克了中⽂語料庫的品質瓶頸,從數⼗萬億的資料中清洗、篩選出了5000 億個單字資料⽤於訓練⼤模型。與其他模型相⽐,優質的中⽂語料庫讓「天工」能更好地理解中⽂語境、詞彙和語法特點,更準確地理解中⽂⽤⼾意圖,更符合本⼟⽤⼾的使⽤偏好。

大型語言模型的築成,有它本身的技術門檻,絕非一日之功。這也是為什么如今「打造又一 OpenAI」、「追趕 GPT-4」等言論眾多,但真正有潛力或已演化為產品級應用的成果卻相對稀缺。

能夠率先交出「天工」這份答案卷,是因為崑崙萬維對於 AI 領域的深耕在數年前就已開始。崑崙萬維從 2020 年開始佈置 AIGC 領域,「天工」⼤模型的誕⽣,也是這些年長期累積的結果。在「天工」之前,崑崙萬維已將四項百億級AIGC 模型開源,包括圖像AI“天工巧繪”、音樂AI“天工樂府”,文本AI“天工妙筆”,編程AI“天工智碼」。

崑崙萬維CEO 方漢表示,崑崙萬維旗下業務包括瀏覽器、社交娛樂、新聞、遊戲等板塊,覆蓋全球五大洲七十多個國家,和內容的關聯性都非常強,所以對內容生成方面的技術進展一直非常敏感,GPT-3 誕生後,管理層判斷這是內容生成領域的一個里程碑,從2020 年起就開始在音樂AI 領域投入。而奇點智源早在 2020 年就意識到 AI 技術在未來的應用潛力,當年就開始在大模型領域投入,並在 2021 年發布了百億級大模型。

到了 2022 年,崑崙萬維開始從音樂 AI 往多模態 AI 拓展,而只有自研千億級大模型,才能建立核心壁壘、掌握主動權。此時的奇點智源也越發強烈意識到千億級大模型是 AGI 的一個突破口,雙方一拍即合,合作自研「天工」成了一個水到渠成的選擇。 

放眼大模型賽道的未來,多模態預訓練大模型將成為必爭之地。這也是「天工」進化的必經之路。挑戰在於,圖像、影片理解所消耗的資源更多,所需的訓練卡以及訓練資源同樣更多,或許真正具備數據、演算法、算力三方面實力的玩家才能堅持到最後。

對於「天工」的未來,你有哪些期待?

以上是寫週報、改代碼,連續互動20輪,國產類ChatGPT新玩家「天工」來了的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

<🎜>:泡泡膠模擬器無窮大 - 如何獲取和使用皇家鑰匙
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
北端:融合系統,解釋
4 週前 By 尊渡假赌尊渡假赌尊渡假赌
Mandragora:巫婆樹的耳語 - 如何解鎖抓鉤
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1669
14
CakePHP 教程
1428
52
Laravel 教程
1329
25
PHP教程
1273
29
C# 教程
1256
24
C  中的chrono庫如何使用? C 中的chrono庫如何使用? Apr 28, 2025 pm 10:18 PM

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

如何理解C  中的DMA操作? 如何理解C 中的DMA操作? Apr 28, 2025 pm 10:09 PM

DMA在C 中是指DirectMemoryAccess,直接內存訪問技術,允許硬件設備直接與內存進行數據傳輸,不需要CPU干預。 1)DMA操作高度依賴於硬件設備和驅動程序,實現方式因係統而異。 2)直接訪問內存可能帶來安全風險,需確保代碼的正確性和安全性。 3)DMA可提高性能,但使用不當可能導致系統性能下降。通過實踐和學習,可以掌握DMA的使用技巧,在高速數據傳輸和實時信號處理等場景中發揮其最大效能。

C  中的實時操作系統編程是什麼? C 中的實時操作系統編程是什麼? Apr 28, 2025 pm 10:15 PM

C 在實時操作系統(RTOS)編程中表現出色,提供了高效的執行效率和精確的時間管理。 1)C 通過直接操作硬件資源和高效的內存管理滿足RTOS的需求。 2)利用面向對象特性,C 可以設計靈活的任務調度系統。 3)C 支持高效的中斷處理,但需避免動態內存分配和異常處理以保證實時性。 4)模板編程和內聯函數有助於性能優化。 5)實際應用中,C 可用於實現高效的日誌系統。

給MySQL表添加和刪除字段的操作步驟 給MySQL表添加和刪除字段的操作步驟 Apr 29, 2025 pm 04:15 PM

在MySQL中,添加字段使用ALTERTABLEtable_nameADDCOLUMNnew_columnVARCHAR(255)AFTERexisting_column,刪除字段使用ALTERTABLEtable_nameDROPCOLUMNcolumn_to_drop。添加字段時,需指定位置以優化查詢性能和數據結構;刪除字段前需確認操作不可逆;使用在線DDL、備份數據、測試環境和低負載時間段修改表結構是性能優化和最佳實踐。

怎樣在C  中測量線程性能? 怎樣在C 中測量線程性能? Apr 28, 2025 pm 10:21 PM

在C 中測量線程性能可以使用標準庫中的計時工具、性能分析工具和自定義計時器。 1.使用庫測量執行時間。 2.使用gprof進行性能分析,步驟包括編譯時添加-pg選項、運行程序生成gmon.out文件、生成性能報告。 3.使用Valgrind的Callgrind模塊進行更詳細的分析,步驟包括運行程序生成callgrind.out文件、使用kcachegrind查看結果。 4.自定義計時器可靈活測量特定代碼段的執行時間。這些方法幫助全面了解線程性能,並優化代碼。

數字虛擬幣交易平台top10 安全可靠的十大數字貨幣交易所 數字虛擬幣交易平台top10 安全可靠的十大數字貨幣交易所 Apr 30, 2025 pm 04:30 PM

數字虛擬幣交易平台top10分別是:1. Binance,2. OKX,3. Coinbase,4. Kraken,5. Huobi Global,6. Bitfinex,7. KuCoin,8. Gemini,9. Bitstamp,10. Bittrex,這些平台均提供高安全性和多種交易選項,適用於不同用戶需求。

量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 量化交易所排行榜2025 數字貨幣量化交易APP前十名推薦 Apr 30, 2025 pm 07:24 PM

交易所內置量化工具包括:1. Binance(幣安):提供Binance Futures量化模塊,低手續費,支持AI輔助交易。 2. OKX(歐易):支持多賬戶管理和智能訂單路由,提供機構級風控。獨立量化策略平台有:3. 3Commas:拖拽式策略生成器,適用於多平台對沖套利。 4. Quadency:專業級算法策略庫,支持自定義風險閾值。 5. Pionex:內置16 預設策略,低交易手續費。垂直領域工具包括:6. Cryptohopper:雲端量化平台,支持150 技術指標。 7. Bitsgap:

deepseek官網是如何實現鼠標滾動事件穿透效果的? deepseek官網是如何實現鼠標滾動事件穿透效果的? Apr 30, 2025 pm 03:21 PM

如何實現鼠標滾動事件穿透效果?在我們瀏覽網頁時,經常會遇到一些特別的交互設計。比如在deepseek官網上,�...

See all articles