首頁 科技週邊 人工智慧 AI產業研發:生成式文字後即將爆發生成式音訊?

AI產業研發:生成式文字後即將爆發生成式音訊?

Jun 09, 2023 pm 10:58 PM
生成式音訊 產業研究

AI產業研發:生成式文字後即將爆發生成式音訊?

在爆發全球熱潮之前,人工智慧是經過了多年醞釀的。為了正確預測未來的人工智慧創新,我們回到源頭,研究了人工智慧應用的專利和創投交易活動。

我們收集了193個世界智慧財產權組織(WIPO)成員在2012年至2022年期間公佈的17,5072項人工智慧專利,分為五大類。對於創投投資,我們使用了經合組織(OECD)人工智慧資料庫2012年至2022年92個經濟體的24,310筆交易資料。

以絕對值計算,自2012年以來,人工智慧領域的創投活動和專利數量激增。期間,創投交易數量增加了10倍,達到3,884筆,2022年的交易價值幾乎是2012年的50倍,達到830億美元。同時,人工智慧專利數量在2022年成長了7倍,達到近3.7萬個。

從創投交易和專利來看,過去10年,超過三分之二的人工智慧創新集中在交通、工業和消費等產業應用。

接下來,我們預期生成式音訊(generative audio)將在2024年大規模出現,並顛覆遊戲和電影製作等產業。

AI產業研發:生成式文字後即將爆發生成式音訊?

人工智慧走出冬眠

#隨著OpenAI的ChatGPT於2022年11月發布,人們對人工智慧的興趣激增,不僅是普通人,企業也是如此。 2022年,公司文件中提到「人工智慧」的次數超過71.5萬次,而2020年僅13.5萬次。根據我們的調查,到2023年4月,41%的美國人已經聽說過ChatGPT,而近60%的人表示他們的工作已經在某種程度上開始使用ChatGPT。

AI產業研發:生成式文字後即將爆發生成式音訊?

此外,在5月18日的新聞中,ChatGPT在美國發布了第一個應用程式版本後,現在可以在iPhone上使用。谷歌也於5月5日宣布,將開始推出整合到搜尋產品中的生成式人工智慧工具。在進一步研究之前,我們先對人工智慧進行簡單的定義——人工智慧是一種基於機器的系統,人類給出一組給定的目標,它可以做出預測、建議甚至決定,這可能會影響現實或虛擬環境。

人工智慧其實已經醞釀好幾年了。自2012年以來,與人工智慧相關的創投交易活動和已公佈的專利一直在悄悄飆升。例如,創投數量從2012年的332筆增加到2022年的3884筆。 2022年,創投交易價值達830億美元,高於2012年的18億美元。同時,自2012年以來,人工智慧的專利數量增加了7倍。

人工智慧產業的進入門檻一直在降低,這刺激了該領域的商業創新。例如,自2018年以來,影像分類系統的訓練成本降低了64%,而訓練時間減少了94%。包括OpenAI、Anthropic、Stability AI、A121 Labs、Midjourney和Cohere在內的眾多新創公司和創投公司也紛紛湧現。據報道,Anthropic最近在C輪融資中籌集了4.5億美元,參與融資的有Alphabet、賽富時(Salesforce)和Zoom。此外,一家倫敦的人工智慧公司Builder. Ai在最新一輪融資中籌集了2.5億美元。

為了正確預測人工智慧即將到來的情況,我們也研究了該領域的專利。我們預計,獲得創投的公司大約需要兩到三年才能將產品推向市場,甚至需要更長的時間等待專利批准,例如七至十年。就專利而言,在公司專利獲得保護後,他們則需要行銷,選擇商業夥伴等,這大概需要一到三年時間。

透過世界智慧財產權組織Patentscope,我們收集了193個該組織成員在2012年至2022年期間公佈的175072項人工智慧專利條目,這些專利分為五大類,其中包括部門應用(sectoral applications)、服務平台(horizo​​ntal platforms)、自動化機器(autonomous machines)和半導體(semiconductors)。在創投方面,我們使用的是經合組織人工智慧資料庫涵蓋的92個經濟體的24310筆交易。

1. 人工智慧景觀-將創意帶入生活

股市反應如何

#

迅速採用ChatGPT和其他新的人工智慧的公司股價飆升。例如,2023年1月31日,人工智慧軟體企業C3. ai推出了集OpenAI、Google、學術研究等人工智慧技術於一體的「生成式人工智慧產品套件」。當日,該公司股價上漲近22%,自今年初以來已累計上漲143%。

人工智慧音訊和語音辨識軟體公司SoundHound的股價今年迄今已上漲66%。

不只是人工智慧軟體公司,人工智慧幾乎影響了價值鏈上的所有公司。英偉達是一家半導體公司,其生產的電腦晶片可以運行人工智慧模型,該公司股價上漲了110%。在大型科技公司之間的人工智慧競賽中,Meta也表現出色。

AI產業研發:生成式文字後即將爆發生成式音訊?

資金流向人工智慧

#2022年,全球對人工智慧的創投達到830億美元的峰值,高於2012年的18億美元。 Databricks和麻省理工學院發現,大多數公司已經開始廣泛部署人工智慧。在樣本中,到2022年未使用人工智慧的公司比例不到6%。

AI產業研發:生成式文字後即將爆發生成式音訊?

企業將從人工智慧成長中受益

多年來,人工智慧研究一直局限於學術界,如今正被應用於商業領域。學術界是先行者,從學術發表到獲得專利通常需要15年的時間。

然而,越來越明顯的是,人工智慧創新爆發的時機已經成熟。從2012年到2022年,49%的創投交易是在過去三年達成的。同樣,我們的資料庫中有52%的人工智慧相關專利在三年內發布。

AI產業研發:生成式文字後即將爆發生成式音訊?

2. 應用領域:人工智慧將在2023年成為主流

亞馬遜創辦人兼執行主席Jeff Bezos表示:「我們現在正在用機器學習和人工智慧來解決問題,現在發生的這一切都猶如科幻小說中所描述的內容。」

過去10年,與人工智慧相關的創投交易中,近五分之四是在產業應用領域。另有8%發生在自動化機器和汽車領域,還有13%發生在半導體領域。人工智慧相關專利的比例也類似。

AI產業研發:生成式文字後即將爆發生成式音訊?

產業應用:人工智慧不限於一個產業

目前,79%的創投交易和61%的專利發生在我們認為的「產業應用」。根據我們的定義,這包括消費、工業、資訊科技、運輸、醫療保健、金融服務業。

從2012年到2022年,創投交易數量從270筆增加到3006筆,增加了10倍多。 2022年,交易總額達620億美元,遠高於2012年的13億美元。在這些領域發布的專利也在蓬勃發展。自2012年以來,相關專利數量增加了6倍。擁有最多專利的公司都是公認的科技巨頭,如IBM、三星(Samsung)、英特爾(Intel)、LG電子(LG Electronics)和高通(Qualcomm)。

AI產業研發:生成式文字後即將爆發生成式音訊?

服務平台:AI工具

#自2012年以來,我們看到服務平台(horizo​​ntal platforms)的專利數量增加了近6倍,包括人工智慧主核(AI core)、自然語言技術(natural language technology)、人工智慧自動化平台( AI automation platforms)、電腦視覺軟體(computer vision software)。服務型應用(Horizo​​ntal applications)是人工智慧開發和部署的重點模組,擁有這類專利的公司包括AT&T、IBM、LG電子、百度以及老牌科技企業。

AI產業研發:生成式文字後即將爆發生成式音訊?

自然語言處理(Natural language processing)是一種用於大型語言模型(LLMs)的人工智慧工具,隨著ChatGPT的出現而變得流行。自然語言處理的一些例子包括翻譯、自動糾錯、自動文字摘要、聊天機器人,以及金融領域的資訊需求等處理方式。

電腦視覺涉及使用人工智慧來分析視覺數據,並做出有意義的預測,包括臉部辨識、地理空間分析等。

微軟的Inner Eye技術已經可以幫助檢測腫瘤和異常細胞。在他們的最新研究中,微軟展示了其技術如何幫助臨床醫生。在電腦視覺專利數量最多的五家公司中,有兩家是中國公司,分別是百度和華為。

誰還需要駕照?自動駕駛已經到來

AI產業研發:生成式文字後即將爆發生成式音訊?

在過去十年中,8%的創投交易和16%的專利都發生在「自動化機器」領域。這類技術涵蓋兩個關鍵領域,分別是自動駕駛汽車和智慧機器人。在過去的十年裡,這個領域受到了許多關注。這在很大程度上與特斯拉的成功相吻合,特斯拉一直在試驗自動駕駛汽車系統。

從2012年到2022年,自動化機器領域的創投交易數量從22筆增加到363筆。智慧機器人就屬於這一類。這些機器人能夠在不需要人類幹預和輸入的情況下進行一定程度的操作。人工智慧通常用於協助機器人機型訓練和適應。三星、LG電子、英特爾以及中國的大疆公司和滴滴等公司在機器人專利方面地位穩固。

幾年來,自動駕駛汽車也一直是人們討論的焦點。除了特斯拉之外,其他公司也在擴大對自動駕駛汽車所需技術的研究和投資,因此,創投和專利申請的大幅增加很可能是在這個背景下發生的。

半導體晶片

#英偉達執行長黃仁勳表示:「很明顯,人工智慧將影響每個產業。我認為每個國家都需要確保人工智慧是其國家戰略的一部分,每個國家都會受到影響。」

AI產業研發:生成式文字後即將爆發生成式音訊?

半導體佔人工智慧相關風投交易的13%,佔已公佈專利的4%,包括處理器設計(processor design)、邊緣人工智慧軟體(edge AI software)、智慧感測器和裝置(intelligent sensors & devices)。

從2012年到2022年,半導體領域的創投交易從40筆增加到515筆。 2022年,該領域交易總額達94億美元,高於2012年的2億美元。同樣,從2012年到2022年,該領域專利數量增加了7倍。

自1970年代以來,晶片經歷了快速的創新,晶片性能每隔幾年就會翻倍。生產商必須跟上發展的步伐,否則就有被甩在後面的風險。隨著科技變得越來越複雜,新工具是必要的,這正是人工智慧可以發揮作用的地方。

3. 2024年及以後的新機會

生成式音訊可能是下一個大熱門

AI產業研發:生成式文字後即將爆發生成式音訊?

人工智慧現在能夠根據不同語言、口音和方言的文字輸入創造人類的聲音和合成音訊。它使用了在ChatGPT中流行的生成式人工智慧。

從2020年第一季到2022年第四季,提到「生成式音訊(generative audio)」的公司檔案數量增加了13倍以上。

隨著音樂和聲音研發的深入,我們可能會看到新競爭者的爆炸性增長。很快,人們可以輸入文字或圖像來產生音訊內容,而不需要音訊專家或電腦專家。

這可能會影響遊戲、通訊、音樂、新聞和醫療保健等一系列領域。擁有生成式音訊相關專利最多的公司包括索尼(Sony)、亞馬遜、華為、位元組跳動、Adobe、蘋果和騰訊。

可以產生什麼音訊?

生成式音訊分為四個主要類別,包括合成聲音(synthetic voice)、語音互動(speech interaction)、音樂生成(music generation)和音訊編輯(audio editing)。首先,透過深度學習,人工智慧可以高品質地合成真實的人聲,包括音高、音調和節奏。語音互動包括虛擬助理等技術,例如蘋果的Siri和亞馬遜的Alexa。隨著科技的發展,人類與人工智慧之間的「自然」互動可能會越來越多。

音樂生成技術可以輕鬆創造出種類繁多的新音樂。例如Spotify的DJ和Aimi Studio。人工智慧音樂已經對音樂產業構成了挑戰。

最後,音訊編輯可以使用人工智慧來提高音訊錄製品質。

AI產業研發:生成式文字後即將爆發生成式音訊?

結論

人工智慧來了,新的創新就在眼前。以專利和創投等指標進行衡量,人工智慧領域的創新在過去10年呈現爆炸性成長。從創投活動和專利來看,過去十年中,超過三分之二的人工智慧創新集中在交通、工業和消費者應用等領域,其次是自動化機器和服務型應用、半導體產業。

在2023年後,我們預期生成音訊創新將會激增。隨著ChatGPT和DALL-E的到來,我們已經看到生成式人工智慧引起了世界的關注。這些技術將共同改變遊戲和電影製作等產業。

作 者 | BT財經

來 源 | 德意志銀行

以上是AI產業研發:生成式文字後即將爆發生成式音訊?的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

最佳AI藝術生成器(免費付款)創意項目 最佳AI藝術生成器(免費付款)創意項目 Apr 02, 2025 pm 06:10 PM

本文回顧了AI最高的藝術生成器,討論了他們的功能,對創意項目的適用性和價值。它重點介紹了Midjourney是專業人士的最佳價值,並建議使用Dall-E 2進行高質量的可定製藝術。

開始使用Meta Llama 3.2 -Analytics Vidhya 開始使用Meta Llama 3.2 -Analytics Vidhya Apr 11, 2025 pm 12:04 PM

Meta的Llama 3.2:多模式和移動AI的飛躍 Meta最近公佈了Llama 3.2,這是AI的重大進步,具有強大的視覺功能和針對移動設備優化的輕量級文本模型。 以成功為基礎

最佳AI聊天機器人比較(Chatgpt,Gemini,Claude&更多) 最佳AI聊天機器人比較(Chatgpt,Gemini,Claude&更多) Apr 02, 2025 pm 06:09 PM

本文比較了諸如Chatgpt,Gemini和Claude之類的頂級AI聊天機器人,重點介紹了其獨特功能,自定義選項以及自然語言處理和可靠性的性能。

頂級AI寫作助理來增強您的內容創建 頂級AI寫作助理來增強您的內容創建 Apr 02, 2025 pm 06:11 PM

文章討論了Grammarly,Jasper,Copy.ai,Writesonic和Rytr等AI最高的寫作助手,重點介紹了其獨特的內容創建功能。它認為Jasper在SEO優化方面表現出色,而AI工具有助於保持音調的組成

AV字節:Meta' llama 3.2,Google的雙子座1.5等 AV字節:Meta' llama 3.2,Google的雙子座1.5等 Apr 11, 2025 pm 12:01 PM

本週的AI景觀:進步,道德考慮和監管辯論的旋風。 OpenAI,Google,Meta和Microsoft等主要參與者已經釋放了一系列更新,從開創性的新車型到LE的關鍵轉變

向員工出售AI策略:Shopify首席執行官的宣言 向員工出售AI策略:Shopify首席執行官的宣言 Apr 10, 2025 am 11:19 AM

Shopify首席執行官TobiLütke最近的備忘錄大膽地宣布AI對每位員工的基本期望是公司內部的重大文化轉變。 這不是短暫的趨勢。這是整合到P中的新操作範式

10個生成AI編碼擴展,在VS代碼中,您必須探索 10個生成AI編碼擴展,在VS代碼中,您必須探索 Apr 13, 2025 am 01:14 AM

嘿,編碼忍者!您當天計劃哪些與編碼有關的任務?在您進一步研究此博客之前,我希望您考慮所有與編碼相關的困境,這是將其列出的。 完畢? - 讓&#8217

選擇最佳的AI語音生成器:評論的頂級選項 選擇最佳的AI語音生成器:評論的頂級選項 Apr 02, 2025 pm 06:12 PM

本文評論了Google Cloud,Amazon Polly,Microsoft Azure,IBM Watson和Discript等高級AI語音生成器,重點介紹其功能,語音質量和滿足不同需求的適用性。

See all articles