以假亂真,天工音樂大模型帶來顛覆式AI體驗
昨日,崑崙萬維AI音樂生成大模型「天工SkyMusic」開啟了免費邀測活動。誠摯邀請媒體、業界專家以及有興趣的音樂從業者們共同體驗SOTA的音樂大模型產品。該產品能夠讓使用者產生身臨其境的體驗,同時共同體驗人聲情感表達。
邀請開始後,廣大用戶對「天工SkyMusic」AI音樂產生大模型的期望很高。工作人員在極短時間內收到了數十萬份測試申請,其中包括眾多專業的音樂創作人、媒體及行業專家。同時,也有大量測試申請源源不絕地發至後台。在申請中,包括眾多專業的音樂創作人、媒體及行業專家,還有大量的測試申請需要被源源不斷地篩選和審查。申請人中有許多是包括眾多專業的音樂創作人、媒體及行業專家的包括眾多專業的音樂創作人、媒體及行業專家,在測試過程中不斷提供寶貴的反饋和意見
#同時,我們也收到了大量來自用戶的真實反饋與高度評價:
“人聲很清晰抒情旋律也好”
“好聽!”
「這是天工做的??太厲害了!」
「《悟空》這首歌是唱氣息的,感情很到位,基本上代表了生成情感以假亂真的能力巔峰之作”
“天工SkyMusic在高音演唱技巧上超出我的想像,非常優秀。”
「太強了,1、AI音樂使用者群體非常大;2、生成的音樂可以重複使用;3、很容易做社交裂變」
「副歌部分真絲滑,Beat真好」
「沒想到中國團隊做的東西比國外的好」
用戶AI音樂生成作品
廣大用戶的熱情回饋既然讓我們看到了業界對於「天工SkyMusic」AI音樂生成大模型的高度期待,也讓我們看到了在以「智力」為主的AGI大模型探索方向中,「情感AGI」的重要意義。
比較文字和圖片,音訊內容是理解人類情感最好的方式,而音樂又是人類情感表達最充沛、最不受地域和文化限制的內容載體,不論時代變幻,不論是戰爭還是災禍,人們總是能透過音樂傳遞自己的感受並獲得情感的慰藉。這是「天工SkyMusic」的創作初衷,也是崑崙萬維情感AGI持續探索的重要方向。
我們感謝所有積極參與並熱情回饋的使用者們,感謝你們的支持、鼓勵與陪伴,我們將持續迭代、優化、拓寬「天工SkyMusic」的能力邊界,讓模型具備更強的多模態情感理解與表達能力,為使用者帶來更優質的AI音樂體驗。
最後,我們很快就會給出「天工SkyMusic」音樂創作Prompt指南,並提供更多的AI音樂Demo與使用技巧,與用戶一同探索AI音樂的強大魅力!
關於「天工SkyMusic」與「天工3.0」
「天工SkyMusic」AI音樂生成大模型是基於崑崙萬維「天工3.0”超級大模型打造。 4月17日,「天工SkyMusic」將隨「天工3.0」同步開啟公測。
申請網頁:https://rg975ojk5z.feishu.cn/share/base/form/shrcnTcBRpGzv5Sx9xAGd5V97Md
「天工3.0」採用4千億級參數MoE混合專家模型,並將同步選擇開源,是全球模型參數最大、效能最強的MoE模型之一。相較於上一代「天工2.0」MoE大模型,「天工3.0」在模型語意理解、邏輯推理、以及通用性、泛化性、不確定性知識、學習能力等領域擁有驚人的表現提升,其模型技術知識能力提升超過20%,數學/推理/程式/文創能力提升超過30%。同時,「天工3.0」新增了搜尋增強、研究模式、呼叫程式碼及繪製圖表、多次呼叫連網搜尋等能力,並針對性地訓練了模型的Agent能力,使得「天工3.0」能夠獨立完成規劃、呼叫、組合外部工具及訊息,以精準且有效率地完成產業分析、產品對比等各類複雜需求,帶來全新的顛覆式人工智慧體驗。
「天工SkyMusic」是目前國內首款且唯一公開可用的AI音樂生成大模型,其採用音樂音頻領域類Sora模型架構,Large-scale Transformer 負責譜曲,來學習Music Patches 的上下文依賴關係,同時完成音樂可控性;Diffusion Transformer 負責演唱,透過LDM讓Music Patches被還原成高質量音頻,使得“天工SkyMusic”能夠支持生成80秒44100Hz 採樣率雙聲道立體聲歌曲。這套模型架構在處理視訊、音訊和音樂領域效果極佳。崑崙萬維團隊也將在後續逐步迭代和添加新的能力,讓模型具備多模態的情感理解與表達能力。
「天工SkyMusic」测试申请网页:https://rg975ojk5z.feishu.cn/share/base/form/shrcnTcBRpGzv5Sx9xAGd5V97Md
「天工SkyMusic」具有以下五大特点:
1. 高质量AI音乐
「天工SkyMusic」能够生成80秒44100Hz采样率双声道立体声AI歌曲,并可根据用户输入的歌词风格生成对应歌曲风格。
2. 人声“以假乱真”
人声合成是AI音乐生成中最重要、最能体现生成效果和品质的维度。「天工SkyMusic」的AI人声合成能够达到业内顶尖的SOTA水平,中文水平极为优秀,发音清晰、无异响。其中文演唱效果更是显著好于国外产品,领先世界水平。
3. 歌词段落控制
「天工SkyMusic」能够通过歌词来控制歌曲,让生成的歌曲可以明确分辨出不同歌词段落的情绪变化,体现出主歌和副歌、前奏和主歌的段落差异。
4. 多种音乐风格
「天工SkyMusic」支持说唱、民谣、放克、古风、电子等多种音乐风格,用户在创作音乐时,可以通过参考音频制定想要的音乐风格。
5. 音乐智能表达 - 歌唱技巧学习
「天工SkyMusic」同时能够学习如颤音、歌剧、吟唱、男女对唱,自动和声等多种歌唱技巧,让用户创作的歌曲得到更恰当的情感表达。
2023 年,昆仑万维在 “All in AGI 和 AIGC” 的战略推动下,在人工智能领域取得了许多进展,逐步形成了AI大模型、AI搜索、AI音乐、AI动漫、AI 社交、AI游戏等AI业务矩阵。
当前,昆仑万维已打造了集AI搜索、AI写作、AI长文本阅读、AI对话、AI语音合成、AI图片生成、AI漫画创作、AI图片识别、AI音乐生成、AI代码写作、AI表格生成等多项能力于一体的「天工3.0」多模态“超级模型”(Super Model),成为AI行业全新里程碑。
以上是以假亂真,天工音樂大模型帶來顛覆式AI體驗的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

但可能打不過公園裡的老大爺?巴黎奧運正在如火如荼地進行中,乒乓球項目備受關注。同時,機器人打乒乓球也取得了新突破。剛剛,DeepMind提出了第一個在競技乒乓球比賽中達到人類業餘選手等級的學習型機器人智能體。論文地址:https://arxiv.org/pdf/2408.03906DeepMind這個機器人打乒乓球什麼程度呢?大概和人類業餘選手不相上下:正手反手都會:對手採用多種打法,機器人也能招架得住:接不同旋轉的發球:不過,比賽激烈程度似乎不如公園老大爺對戰。對機器人來說,乒乓球運動

8月21日,2024世界機器人大會在北京隆重召開。商湯科技旗下家用機器人品牌「元蘿蔔SenseRobot」家族全系產品集體亮相,並最新發布元蘿蔔AI下棋機器人-國際象棋專業版(以下簡稱「元蘿蔔國象機器人」),成為全球首個走進家庭的西洋棋機器人。作為元蘿蔔的第三款下棋機器人產品,全新的國象機器人在AI和工程機械方面進行了大量專項技術升級和創新,首次在家用機器人上實現了透過機械爪拾取立體棋子,並進行人機對弈、人人對弈、記譜複盤等功能,

開學將至,該收心的不只即將開啟新學期的同學,可能還有AI大模型。前段時間,Reddit擠滿了吐槽Claude越來越懶的網友。 「它的水平下降了很多,經常停頓,甚至輸出也變得很短。在發布的第一周,它可以一次性翻譯整整4頁文稿,現在連半頁都輸出不了!」https:// www.reddit.com/r/ClaudeAI/comments/1by8rw8/something_just_feels_wrong_with_claude_in_the/在一個名為“對Claude徹底失望了的帖子裡”,滿滿地

在北京舉行的世界機器人大會上,人形機器人的展示成為了現場絕對的焦點,在星塵智能的展台上,由於AI機器人助理S1在一個展區上演揚琴、武術、書法三台大戲,能文能武,吸引了大量專業觀眾和媒體的駐足。在有彈性的琴弦上優雅的演奏,讓S1展現出速度、力度、精準度兼具的精細操作與絕對掌控。央視新聞對「書法」背後的模仿學習和智慧控制進行了專題報道,公司創始人來傑解釋到,絲滑動作的背後,是硬體側追求最好力控和最仿人身體指標(速度、負載等),而是在AI側則採集人的真實動作數據,讓機器人遇強則強,快速學習進化。而敏捷

本屆ACL大會,投稿者「收穫滿滿」。為期六天的ACL2024正在泰國曼谷舉辦。 ACL是計算語言學和自然語言處理領域的頂級國際會議,由國際計算語言學協會組織,每年舉辦一次。一直以來,ACL在NLP領域的學術影響力都名列第一,它也是CCF-A類推薦會議。今年的ACL大會已是第62屆,接收了400餘篇NLP領域的前沿工作。昨天下午,大會公佈了最佳論文等獎項。此次,最佳論文獎7篇(兩篇未公開)、最佳主題論文獎1篇、傑出論文獎35篇。大會也評出了資源論文獎(ResourceAward)3篇、社會影響力獎(

視覺與機器人學習的深度融合。當兩隻機器手絲滑地互相合作疊衣服、倒茶、將鞋子打包時,加上最近老上頭條的1X人形機器人NEO,你可能會產生一種感覺:我們似乎開始進入機器人時代了。事實上,這些絲滑動作正是先進機器人技術+精妙框架設計+多模態大模型的產物。我們知道,有用的機器人往往需要與環境進行複雜精妙的交互,而環境則可被表示成空間域和時間域上的限制。舉個例子,如果要讓機器人倒茶,那麼機器人首先需要抓住茶壺手柄並使之保持直立,不潑灑出茶水,然後平穩移動,一直到讓壺口與杯口對齊,之後以一定角度傾斜茶壺。這

今天下午,鸿蒙智行正式迎来了新品牌与新车。8月6日,华为举行鸿蒙智行享界S9及华为全场景新品发布会,带来了全景智慧旗舰轿车享界S9、问界新M7Pro和华为novaFlip、MatePadPro12.2英寸、全新MatePadAir、华为毕昇激光打印机X1系列、FreeBuds6i、WATCHFIT3和智慧屏S5Pro等多款全场景智慧新品,从智慧出行、智慧办公到智能穿戴,华为全场景智慧生态持续构建,为消费者带来万物互联的智慧体验。鸿蒙智行:深度赋能,推动智能汽车产业升级华为联合中国汽车产业伙伴,为

會議簡介隨著科技的快速發展,人工智慧成為了推動社會進步的重要力量。在這個時代,我們有幸見證並參與分散式人工智慧(DistributedArtificialIntelligence,DAI)的創新與應用。分散式人工智慧是人工智慧領域的重要分支,這幾年引起了越來越多的關注。基於大型語言模型(LLM)的智能體(Agent)異軍突起,透過結合大模型的強大語言理解和生成能力,展現了在自然語言互動、知識推理、任務規劃等方面的巨大潛力。 AIAgent正在接棒大語言模型,成為目前AI圈的熱門話題。 Au
