騰訊自研混元大模型正式亮相,透過騰訊雲對外開放
國產大模型進入長跑期,從參數至上轉向實用優先。
9月7日,在2023騰訊全球數位生態大會上,騰訊混元大模型正式亮相,並宣布透過騰訊雲對外開放。
騰訊混元大模型是由騰訊全鏈路自研的通用大語言模型,擁有超千億參數規模,預訓練語料超2萬億tokens,具備強大的中文創作能力,複雜語境下的邏輯推理能力,以及可靠的任務執行能力。
值得關注的是,騰訊混元大模型是「從實踐來,到實踐中去」的實用級大模型。騰訊雲、騰訊廣告、騰訊遊戲、騰訊金融科技、騰訊會議、騰訊文件、微信搜一搜、QQ瀏覽器等超過50個騰訊業務及產品,已接入騰訊混元大模型測試,並取得初步效果。
據了解,混元大模型將作為騰訊雲MaaS服務的底座,客戶不僅可以直接透過API呼叫混元,也可以將混元作為基底模型,為不同產業場景建構專屬應用。
騰訊集團資深執行副總裁、雲端與智慧產業事業群CEO湯道生表示:「以大模型生成技術為核心,人工智慧正成為下一輪數位化發展的關鍵動力,也為解決產業痛點帶來了全新的思維。大模型需要基於產業場景,與企業數據融合,才能釋放出最大的價值。」
久為功,全鏈路技術自研
#據騰訊集團副總裁蔣傑介紹,騰訊混元大模型從第一個token開始從零訓練,掌握了從模型演算法到機器學習框架,再到AI基礎設施的全鏈路自研技術。
騰訊集團副總裁蔣傑
從2021年開始,騰訊先後推出千億和萬億參數的NLP稀疏大模型,打破CLUE三大榜單紀錄,實現在中文理解能力上的新突破。
目前,業界大模型在場景中的應用依然有限,主要集中在容錯率高、任務簡單的休閒場景。騰訊在演算法層面進行了一系列自研創新,提高了模型可靠性和成熟度。
針對大模型容易「胡言亂語」的問題,騰訊優化了預訓練演算法及策略,讓混元大模型的幻覺相比主流開源大模型降低了30%至50%;透過強化學習的方法,讓模型學會識別陷阱問題;透過位置編碼優化,提高了超長文的處理效果和表現;提出思維鏈的新策略,讓大模型能夠像人一樣結合實際的應用場景進行推理和決策。
此外,騰訊也自研了機器學習架構Angel,讓訓練速度相比業界主流架構提升1 倍,推理速度比業界主流架構提升1.3倍。
騰訊混元大模型全連結自研
得歸功於全鏈路自研技術,騰訊混元大模型能夠理解上下文的含義,並且具有長文記憶能力,可以流暢地進行專業領域的多輪對話。除此之外,它還能進行文學創作、文本摘要、角色扮演等內容創作,做到充分理解用戶意圖,並高效、準確的給出有時效性的答复。
在中國信通院《大規模預訓練模型技術與應用的評估方法》的標準符合性測試中,混元大模型共測評66個能力項,在「模型發展」和「模型能力」兩個重要領域的綜合評估均獲得了目前的最高分。在主流的評測集MMLU、CEval和AGI-eval上,混元大模型均有優異的表現,特別是在中文的理科、高考題和數學等子項上表現突出。
上海財經大學校長劉元春認為:「借助於全鏈路自研,中國將持續累積大模型相關人才和技術,逐漸形成體系化的產業鏈、人才鏈、技術鏈和創新鏈,最終走出一條發展通用人工智慧的中國路徑,幫助我們在數位科技的創新上取得突破性進展。」
##騰訊全面擁抱大模型
蔣傑表示:「我們研發大模型的目標不是在評測上獲得高分,而是將科技應用到實際場景中。騰訊將全面擁抱大模型。」
#在此次大會上,蔣傑展示了騰訊會議、騰訊文檔、騰訊廣告等多個業務,在接取騰訊混元大模型後的實際應用情況。
例如騰訊會議基於混元大模型打造了AI小助手,只需要簡單的自然語言指令,就能完成會議資訊擷取、內容分析等複雜任務,會後還能產生智能總結紀要。據實測,在指令理解、會中問答、會議摘要、會議待辦項等多個方面,混元大模型均獲得較高的用戶採納率。
騰訊混元大模型在騰訊會議中的應用
在文件處理方面,騰訊混元大模型支援數十種文字創作場景,在騰訊文件推出的智慧助理功能中已有應用。同時,混元還能夠一鍵生成標準格式文本,精通數百種Excel公式,支援自然語言生成函數,並基於表格內容生成圖表,目前這些功能正在內測階段,將在成熟後面向用戶開放。
在廣告業務場景,騰訊混元大模型支援智慧化的廣告素材創作,能夠適應產業與地理特色,滿足千人千面的需求,實現文字、圖片、影片的自然融合。此外,基於混元大模型的能力,廣告智慧導購能夠幫助商家在企業微信等場景,提升服務品質與服務效率。
騰訊混元大模型在騰訊廣告中的應用
據了解,今年6月,騰訊雲推出了模型即服務(MaaS)解決方案,提供涵蓋模型預訓練、模型精調、智慧應用開發等一站式的行業大模型服務。
最近,騰訊雲也全面接入Llama 2、Bloom等20多個主流模型,和混元一樣,都支援直接部署呼叫。客戶可以根據實際需求,基於混元、也可以基於開源模型,打造出自己專屬的產業大模型。
以上是騰訊自研混元大模型正式亮相,透過騰訊雲對外開放的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

5月30日,騰訊宣布旗下混元大模型全面升級,基於混元大模型的App「騰訊元寶」正式上線,蘋果及安卓應用程式商店皆可下載。相較於先前測試階段的混元小程式版本,面向工作效率場景,騰訊元寶提供了AI搜尋、AI總結、AI寫作等核心能力;面向日常生活場景,元寶的玩法也更加豐富,提供了多個特色AI應用,並新增了創建個人智能體等玩法。 「騰訊做大模型不爭一時之先。」騰訊雲副總裁、騰訊混元大模型負責人劉煜宏表示:「過去的一年,我們持續推進騰訊混元大模型的能力爬坡,在豐富、海量的業務場景中打磨技術,同時洞察用戶的真實需求

5月22日,騰訊雲公佈全新大模型升級方案。主力模型之一混元-lite模型,API輸入輸出總長度計畫從目前的4k升級到256k,價格從0.008元/千tokens調整為全面免費。混元-standardAPI輸入價格從0.01元/千tokens降至0.0045元/千tokens,下降55%,API輸出價格從0.01元/千tokens降至0.005元/千tokens,下降50%。新上線的混元-standard-256k,具備處理超過38萬字符的超長文字能力,API輸入價格下調至0.015元/千toke

據了解,騰訊QQ桌面用戶端進行了一系列的大刀闊斧的改革。針對用戶關於高記憶體佔用、超大安裝包、啟動緩慢等問題,QQ技術團隊在記憶體上進行了專案最佳化,取得了階段性進展。日前,QQ技術團隊在InfoQ平台發布了一篇介紹文章,分享了其在記憶體上進行專案優化的階段性進展。據介紹,新版QQ在記憶體上的挑戰主要表現在以下4個面向:產品形態:由1個複雜的大面板(100+複雜程度不等的模組)和一系列獨立功能視窗構成。視窗與渲染進程一一對應,視窗進程數很大程度影響Electron的記憶體佔用。對於那個複雜的大面板,一旦沒有

大模型落地加速,「產業實用」成為發展共識。 2024年5月17日,騰訊雲生成式AI產業應用高峰會在北京召開,公佈大模型研發、應用產品的系列進度。騰訊混元大模型能力持續升級,多個版本模型hunyuan-pro、hunyuan-standard、hunyuan-lite透過騰訊雲對外開放,滿足企業客戶、開發者在不同場景下的模型需求,落地最優性價比模型方案。騰訊雲大模型知識引擎、影像創作引擎、影片創作引擎三大工具發布,打造大模型時代原生工具鏈,透過PaaS服務簡化資料存取、模式精調、應用開發流程,協助企業

本站8月7日消息,昨日騰訊2025校園招募正式啟動,繼2024年實習生招募、「青雲計畫」AI大模型招募專案後再次發出「擴招」訊號:不僅招募規模相較前兩年有較大增長,面向人群的畢業時間範圍也進一步擴大。據介紹,騰訊2025年校園招募開放技術、產品、市場、設計、職能5個大類70餘種職缺。今年的騰訊校園招募將有多處變化,校招面向人群的畢業時間範圍從一年拓寬至兩年。畢業時間為2024年1月至2025年12月的同學(中國大陸/內地以畢業證為準,中國港澳台及海外地區以學位證為準)均可透過騰訊招聘官網及「騰訊

根據科創板日報的報道,微信視頻號正在加大對直播帶貨的資源投入,為此已經對微信支付和視頻號兩個團隊的組織架構進行了調整據知情人士透露,騰訊的目的是為了實現微信支付和視訊號碼的互通,希望兩個團隊能夠合作共同努力。據稱,這次調整計劃於今年雙11之前後開始,旨在將更多資源投入到“直播帶貨”領域根據本站查詢結果顯示,騰訊是一家著名的互聯網公司,自成立以來已經多次進行組織架構調整,目前包含六大事業群及S線企業發展事業群(CDG)雲與智慧產業事業群(CSIG)互動娛樂事業群(IEG)平台與內容事業群(PCG)技

AniPortrait模型是開源的,可以自由暢玩。 「小破站鬼畜區的新質生產力工具。」近日,騰訊開源發布的一個新項目在推上獲得瞭如此評價。這個項目是AniPortrait,可基於音訊和一張參考圖像生成高品質動畫人像。話不說多,我們先看看可能會被律師函警告的demo:動漫圖像也能輕鬆開口說話:該項目剛上線幾天,就已經收穫了廣泛好評:GitHubStar數已經突破2800。下面我們就來看看AniPortrait的創新之處。論文標題:AniPortrait:Audio-DrivenSynthesisof

近期,騰訊互娛招聘公佈了一則招聘信息,表明光子H工作室正致力於研發一款內容豐富、3A級別的開放世界RPG項目。此次熱門涵蓋了UE5工程師、後台、關卡設計、動作場景設計、角色建模、特效及發行等多個領域,而這些職位的目標工作地點位於網易總部所在地的杭州。
