國內AI大模型「安卓時刻」到來!阿里雲通義千問免費、開源、可商用
阿里巴巴在海外Meta之後,成為另一個推動人工智慧(AI)大模型「安卓時刻」潮流的科技巨頭
根據北京商報的報導,阿里雲將於週四8月3日發布開源的通用問答模型Qwen-7B和對話模型Qwen-7B-Chat,這兩款模型擁有70億參數。它們已經上線了國內首個「模型即服務」開放平台魔搭社區,可以免費使用,商業用途也是允許的
使用者可以透過開源程式碼量化Qwen-7B和Qwen-7B-Chat,並在消費級顯示卡上部署和運行模型。他們可以直接從魔搭社群下載模型,也可以透過阿里雲靈積平台存取並呼叫Qwen-7B和Qwen-7B-Chat。阿里雲為使用者提供包括模型訓練、推理、部署和精調等服務
在魔塔社群上,有貼文專門介紹通義千問模型的安裝方法、創空間體驗、模型推理和模型訓練的最佳實踐,還附有模型連結和下載情況的截圖
根據公開資料,Qwen-7B是一個基座模型,使用去重和過濾後超過2.2兆tokens的資料進行預訓練。它支援中、英等多種語言,並具有8k的上下文視窗長度。模型包含高品質的中、英、多語言、程式碼、數學等數據,涵蓋全網文本、百科、書籍、程式碼、數學以及各領域的垂直領域
根據MMLU評測結果顯示,Qwen-7B在英文評測方面表現出色,超過了其他同類開源預訓練模型,並且與更大規模的模型相比具有競爭力。在中文評測方面,Qwen-7B在C-Eval驗證集上取得了最高分數,甚至與更大規模的模型相比也具有競爭力
以下是比較了Qwen-7B的MMLU 5-shot準確率結果
阿里雲透過對齊機制,建構了基於基座模型的AI助手Qwen-7B-Chat,它是一個基於Transformer的中英文對話大語言模型,已經成功實現了與人類認知的對齊。該模型使用了多樣的預訓練數據,包括網頁文本、專業書籍、程式碼等,涵蓋範圍廣泛
Qwen-7B-Chat模型在C-Eval驗證集和MMLU評測集上的zero-shot準確率都超過了其他同類對準模型
下面是C-Eval測試集上的零-shot準確率結果比較
阿里雲成為國內首家加入大模型開源行列的大型科技企業,今年7月聯合Meta發布了可商用版本的開源AI模型Llama 2,該模型可取代OpenAI和Google的模型。此外,智譜AI及清華KEG實驗室也在7月公佈了中國頂尖的開源大模型
開源模型的優點在於提高使用者接受率和提供更多資料用於人工智慧處理。 LLM的資料量越大,功能越強大。此外,開源模型有助於研究人員和開發人員發現和解決漏洞,提昇技術和安全性等級
在2023年4月的阿里雲峰會上,阿里巴巴宣布向企業開放通義千問,使得企業能夠利用通義千問的能力來訓練自己的大型模型
阿里雲智慧集團技術長(CTO)週靖人表示,未來企業可以充分利用阿里雲的通義千問能力,並結合自身產業知識與應用場景,訓練客製化的企業大模型。例如,每家企業都可以擁有自己的智慧客服、智慧導購、智慧語音助理、文案助理、AI設計師和自動駕駛模型等功能
張勇,阿里巴巴集團CEO兼阿里雲智慧集團CEO,表示阿里巴巴的所有產品都將與通義千問大模型進行整合
阿里雲希望幫助更多企業使用大模型,以適應AI時代的需求,讓每家企業都能擁有自己行業能力的專屬大模型,並基於通義千問進行重構
以上是國內AI大模型「安卓時刻」到來!阿里雲通義千問免費、開源、可商用的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

5月30日,騰訊宣布旗下混元大模型全面升級,基於混元大模型的App「騰訊元寶」正式上線,蘋果及安卓應用程式商店皆可下載。相較於先前測試階段的混元小程式版本,面向工作效率場景,騰訊元寶提供了AI搜尋、AI總結、AI寫作等核心能力;面向日常生活場景,元寶的玩法也更加豐富,提供了多個特色AI應用,並新增了創建個人智能體等玩法。 「騰訊做大模型不爭一時之先。」騰訊雲副總裁、騰訊混元大模型負責人劉煜宏表示:「過去的一年,我們持續推進騰訊混元大模型的能力爬坡,在豐富、海量的業務場景中打磨技術,同時洞察用戶的真實需求

火山引擎總裁譚待企業要做好大模型落地,面臨模型效果、推理成本、落地難度的三大關鍵挑戰:既要有好的基礎大模型做支撐,解決複雜難題,也要有低成本的推理服務讓大模型廣泛應用,還要更多工具、平台和應用程式幫助企業做好場景落地。 ——譚待火山引擎總裁01.豆包大模型首次亮相大使用量打磨好模型模型效果是AI落地最關鍵的挑戰。譚待指出,只有大的使用量,才能打磨出好模型。目前,豆包大模型日均處理1,200億tokens文字、生成3,000萬張圖片。為助力企業做好大模型場景落地,位元組跳動自主研發的豆包大模型將透過火山

本站8月5日消息,阿里雲宣布,2024雲棲大會將於9月19日~21日在杭州雲棲小鎮舉辦,將設三日主論壇、400場分論壇與並行話題以及近四萬平方米展區。雲棲大會對民眾免費開放,即日起民眾可透過雲棲大會官網免費申請暢享票,另有5,000元的全通票可購買,本站附門票網址:https://yunqi.aliyun.com/2024 /ticket-list據介紹,雲棲大會起源於2009年,最初命名為第一屆中國網站發展論壇,2011年演變成阿里雲開發者大會,2015年正式更名為“雲棲大會”,至今已連續成功舉

一、TensorRT-LLM的產品定位TensorRT-LLM是NVIDIA為大型語言模型(LLM)所開發的可擴展推理方案。它基於TensorRT深度學習編譯框架建構、編譯和執行計算圖,並藉鑒了FastTransformer中高效的Kernels實作。此外,它還利用NCCL實現設備間的通訊。開發者可以根據技術發展和需求差異,客製化算子以滿足特定需求,例如基於cutlass開發客製化的GEMM。 TensorRT-LLM是NVIDIA官方推理方案,致力於提供高效能並不斷完善其實用性。 TensorRT-LL

4月4日消息,日前,國家網信辦公佈已備案大模型清單,中國移動「九天自然語言交互大模型」名列其中,標誌著中國移動九天AI大模型可正式對外提供生成式人工智慧服務。中國移動表示,這是同時透過國家「生成式人工智慧服務備案」和「境內深度合成服務演算法備案」雙備案的首個央企研發的大模型。據介紹,九天自然語言交互大模型具有產業能力增強、安全可信、支援全端國產化等特點,已形成90億、139億、570億、千億等多種參數量版本,可靈活部署於雲、邊、端不同場

一、背景簡介首先來介紹雲問科技的發展歷程。雲問科技公...2023年,正是大模型盛行的時期,很多企業認為已經大模型之後圖譜的重要性大大降低了,之前研究的預置的資訊化系統也都不重要了。不過隨著RAG的推廣、資料治理的盛行,我們發現更有效率的資料治理和高品質的資料是提升私有化大模型效果的重要前提,因此越來越多的企業開始重視知識建構的相關內容。這也推動了知識的建構和加工開始向更高層次發展,其中有許多技巧和方法可以挖掘。可見一個新技術的出現,並不是將所有的舊技術打敗,也有可能將新技術和舊技術相互融合後

如果試題太簡單,學霸和學渣都能考90分,拉不開差距……隨著Claude3、Llama3甚至之後GPT-5等更強模型發布,業界急需一款更難、更有區分度的基準測試。大模型競技場背後組織LMSYS推出下一代基準測試Arena-Hard,引起廣泛關注。 Llama3的兩個指令微調版本實力到底如何,也有了最新參考。與先前大家分數都相近的MTBench相比,Arena-Hard區分度從22.6%提升到87.4%,孰強孰弱一目了然。 Arena-Hard利用競技場即時人類數據構建,與人類偏好一致率也高達89.1%

注意看,這個男人把超1000種大模型接入,讓你可插拔無縫切換使用。最近也上線了可視化的AI工作流程:給你一個直覺的拖放介面,拖拖、拉拉、拽拽,就能在無限畫布上編排自己個兒的Workflow。正所謂兵貴神速,量子位聽說,這個AIWorkflow上線不到48小時,就已經有用戶配出了100多個節點的個人工作流程。不賣關子,今天要聊的是LLMOps公司Dify,及其CEO張路宇。張路宇也是Dify的創辦人。投入創業前,有11年的網路經驗。搞產品設計,懂專案管理,也對SaaS有點自己的獨到見解。後來他
