目錄
引言" >引言
#技術概覽" >#技術概覽
#應用" >#應用
結論
#作者介紹" >#作者介紹
首頁 科技週邊 人工智慧 快手提出億級多模態短視訊百科體系-快知(Kuaipedia)

快手提出億級多模態短視訊百科體系-快知(Kuaipedia)

May 20, 2023 pm 05:10 PM
快知(kuaiped

引言

當前,越來越多的短視頻用戶不僅希望利用碎片化的時間來休閒娛樂,也開始希望能夠在短視頻平台中獲取更多知識。 2021年,快手泛知識內容播放量年增58.11%,平台全年有超過3,300萬場泛知識直播 [1]。為了更好地理解和組織泛知識視頻,快手MMU聯合哈爾濱工業大學等提出業界首個多模態短視頻百科——“快知(Kuaipedia)”:通過多模態和知識圖譜技術從海量短視頻中挖掘大規模高品質的知識視頻,並將其結構化,形成體系化的短視頻百科知識庫,提供使用者更好的知識獲取體驗,同時激發創作者創造優質知識內容,建構良性的知識分享生態。

快手提出億級多模態短視訊百科體系-快知(Kuaipedia)

論文連結:## https://www.php.cn/link/b0da9d8dd88178e3bb138e08742eb2e2

##專案首頁:#專案主頁: ##https://www.php.cn/link/1a725948eb0c738707b5c026a65ba618

快手提出億級多模態短視訊百科體系-快知(Kuaipedia)

快手提出億級多模態短視訊百科體系-快知(Kuaipedia)

團隊從快手海量短視頻中挖掘出億級知識類視頻,並對其進行了結構化,構建了千萬級詞條和知識點視頻百科體系。 「快知(Kuaipedia)」的提出有助於學界推動AI透過多模態資訊理解世界知識,且在產業界落地有較大想像空間。 #####################介紹#############百科全書(Encyclopedia),可以追溯到希臘和羅馬,也是17- 18世紀法國啟蒙運動的一個傑出的成果。知識百科通常是指一個是概要介紹人類全部知識或某一特定領域或學科的工具書或綱要,在互聯網急速發展的當下,網絡百科成為知識新的載體,如維基百科、百度百科等。但這些百科通常以圖文、表格為載體,比較難以表達一些需要生動演示的知識,例如教程(How-to)類知識。圖一展示了使用圖文講述 “柴犬”-“怎麼畫” 這一知識的困境。而透過短視頻,我們能夠很好地對這些知識進行一個解釋和學習。 ##################具體影片請見###################https://www.php.cn /link/70e9dbe24ba303f2d25ac34d3ae945c5###################。 ###########################圖一:圖文在how-to類別知識上知識傳遞的困境,圖文來自短影片的幀截圖#########

隨著內容產業和媒體形態的不斷迭代,短影片已經越來越成為知識傳播者的主要媒介,尤其是在一些技能和特長類的知識傳播,天然就有它的一些優勢。而在當下,儘管有公開的網絡百科中有視頻的內容,但通常是偏簡介形式(如秒懂百科),沒有將短視頻最大程度的進行利用,因此短視頻在知識百科中的表達能力被嚴重低估。例如當人們講到“柴犬”,人們除了“簡介” 以外,還關注“怎麼挑”、“怎麼梳毛”、“怎麼糾正護食”等。因此我們認為將知識類的短影片結構化,構成結構化的短影片百科是一條理解世界知識、幫助人類以更高效率傳播知識的有效途徑。

參考國家標準#科普知識 ,技能(How)類別歸結為教程知識,在快手海量的影片中挖掘出高質的知識影片。此外,我們將短影片中抽取的知識主體以詞條形式呈現(如柴犬) ,並抽取影片中講解的該詞條具體的知識點(如柴犬-挑選、柴犬-護食糾正等),最終構成了一個短視頻的百科知識體系,如圖二所示。

快手提出億級多模態短視訊百科體系-快知(Kuaipedia)

圖二:快知-多模態短視訊百科概覽

#「快知(Kuaipedia)」的提出有以下幾個貢獻:

「快知」的定義:我們開創性地定義了一個全新的多模態知識百科庫,以詞條、知識點、知識類短視頻以及它們間的關係共同構成。這是業界首個結構化的多模態短視訊百科。

建立大規模短視頻百科的方法:我們提出使用知識視頻識別、詞條知識點挖掘、多模態知識連結的組合來建構大規模的短視頻百科。並開創性提出「多模態知識連結」任務,作為傳統實體連結的一個外延和擴展。

有潛力與想像空間的應用:在學術上,「快知」以嶄新的知識點短視頻化組織形式,能夠突破目前機器僅靠圖文知識圖譜(KG)理解世界知識的上限,在KG的一些下游任務如實體鏈接、實體分類,或者NLP、CV等內容理解下游任務上,有非常大的潛力。在產業界,「快知」這樣的形式能夠協助短視訊平台進行有效率地運作、組織內容,提升用戶對知識的理解與消費效率。

#技術概覽

為了實現上述的短視訊百科結構化,核心技術包括以下三個主要步驟,如圖三所示。

知識影片辨識:透過多模態影片預訓練模型,理解並辨識海量影片中知識類別影片;

詞條與知識點挖掘:#透過多源知識庫融合「自頂向下」建構詞條體系,再透過對使用者搜尋query挖掘「自底向上」建構詞條與知識點關係,形成詞條知識點樹;

多模態知識連結:創新地擴展傳統「實體連結」任務,提出透過多模態內容理解技術將影片連結到詞條(如柴犬)的某一個知識點(如護食糾正)上的「多模態知識連結」任務。

快手提出億級多模態短視訊百科體系-快知(Kuaipedia)

圖三:快知建構技術連結

透過大量詳實的人工評測,快知所挖掘的知識點與影片已具備較高的準確率與品質。更詳細的演算法和實驗數據具體參見論文或我們的Github主頁(見文章開頭)。

#應用

首先,「快知(Kuaipedia)」這樣的多模態短視頻百科體系,在學術界對於推動AI理解世界知識的技術發展有極大的潛力。一方面,「快知」突破圖文和表格的限制,透過更豐富的知識點和短視頻來描述某一個實體或概念,這種方式能夠推動多模態知識圖譜技術的發展。另一方面,這些知識點和短視頻有助於AI更好地理解世界知識,尤其是一些圖文難表述的How-to 類知識,這種多模態知識能夠增強AI對世界的理解,對KG、NLP、CV等領域的下游應用都很有幫助。我們在CCKS實體鏈指的任務上,證明「快知」多模態知識的簡單引入就能有效提升BERT在實體連結和在實體分類上的表現。

此外,「快知」在產業落地極具想像力,在短視頻生態向「泛知識」拓展的過程中,現有的形式約束了其傳播方式,「快知」透過結構化的內容,能提昇平台的營運與分送效率,更能滿足用戶的求知訴求。我們將該技術首先在健康垂類進行了落地嘗試,快手健康團隊此前以病種為組織維度,純人工挖掘了一批優質PUGC內容,但是存在疾病知識體係不完善、權威性知識視頻量級小等痛點,難以高效率建構完整、大規模、結構化的疾病錄影體系。利用「快知」的技術後,自動化地挖掘出了一批高質量、有快手特色的知識點和知識視頻,豐富了疾病類內容,比純人工構建提效#幾十倍。目前這批內容已經在快手App精選頁上線:點擊精選視頻流中某個疾病類視頻的“底部通欄”,喚起“快手健康”半屏頁,用戶可以消費該視頻所屬詞條下的相關知識點和相關知識視頻,如圖四所示。

快手提出億級多模態短視訊百科體系-快知(Kuaipedia)

圖四:快知在健康場景落地

除健康外,「快知」也涵蓋了教育、美食、三農、親子、法律、科技、金融等眾多領域的知識內容,有著較大的應用潛力。

結論

面對泛知識類內容在短視訊產業的發展前景,我們提出了「快知(Kuaipedia)」多模態短視訊百科體系,從存量的海量短視頻內容入手,透過多模態知識圖譜構建技術挖掘出億級別高質量的知識視頻,並將知識內容結構化,構建業界首個大規模體系化的短視頻百科知識庫,其在學術界和產業界有較大的潛力和想像空間。

#作者介紹

第一作者:潘浩傑

快手MMU知識圖譜中心成員,快知計畫負責人,本碩畢業於浙大和港科大,曾在阿里雲PAI負責大規模NLP演算法與框架,在ACL、EMNLP、KDD、AIJ等頂會頂刊中發表10餘篇論文,多項國內和美國專利,詳見知乎。 2021年加入快手。

通訊作者:付瑞吉

快手MMU知識圖譜中心負責人,本碩博畢業於哈工大,中科大博士後。曾擔任科大訊飛AI研究院副院長,獲吳文俊人工智慧科技進步獎一等獎。在ACL、EMNLP、Coling、IJCAI、TASLP等國際會議及期刊發表學術論文多篇,申請(取得)國家發明專利四十餘項。 2021年加入快手。

合作老師:劉銘

教授/博士生生導師,哈爾濱工業大學計算學部。先後主持國家重點研發計畫計畫議題、國家自然科學基金、中國博士後科學基金特別資助、中國博士後科學基金面上資助一等資助、黑龍江省面上基金等多項基金計畫。獲黑龍江省科學技術一等獎,哈爾濱市科技成果,第六屆全國青年人工智慧創新創業大會一等獎。近年來以第一作者或通訊作者發表CCFA/B類論文20餘篇,參編教材一部,英文譯作一部。擔任NLPCC2020、CCKS2020、COLING2022知識圖譜領域主席,CCKS2019出版主席、CCKS2021評測主席、CCKS2022講習班主席。

參考文獻

#[1] 快手,2022快手泛知識內容生態報告.

[2] 國家標準委員會:知識管理框架,GB/T 23703.

以上是快手提出億級多模態短視訊百科體系-快知(Kuaipedia)的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

AI Hentai Generator

AI Hentai Generator

免費產生 AI 無盡。

熱門文章

R.E.P.O.能量晶體解釋及其做什麼(黃色晶體)
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.最佳圖形設置
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
R.E.P.O.如果您聽不到任何人,如何修復音頻
3 週前 By 尊渡假赌尊渡假赌尊渡假赌
WWE 2K25:如何解鎖Myrise中的所有內容
3 週前 By 尊渡假赌尊渡假赌尊渡假赌

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

我嘗試了使用光標AI編碼的Vibe編碼,這太神奇了! 我嘗試了使用光標AI編碼的Vibe編碼,這太神奇了! Mar 20, 2025 pm 03:34 PM

Vibe編碼通過讓我們使用自然語言而不是無盡的代碼行創建應用程序來重塑軟件開發的世界。受Andrej Karpathy等有遠見的人的啟發,這種創新的方法使Dev

2025年2月的Genai推出前5名:GPT-4.5,Grok-3等! 2025年2月的Genai推出前5名:GPT-4.5,Grok-3等! Mar 22, 2025 am 10:58 AM

2025年2月,Generative AI又是一個改變遊戲規則的月份,為我們帶來了一些最令人期待的模型升級和開創性的新功能。從Xai的Grok 3和Anthropic的Claude 3.7十四行詩到Openai的G

如何使用Yolo V12進行對象檢測? 如何使用Yolo V12進行對象檢測? Mar 22, 2025 am 11:07 AM

Yolo(您只看一次)一直是領先的實時對象檢測框架,每次迭代都在以前的版本上改善。最新版本Yolo V12引入了進步,可顯著提高準確性

Chatgpt 4 o可用嗎? Chatgpt 4 o可用嗎? Mar 28, 2025 pm 05:29 PM

Chatgpt 4當前可用並廣泛使用,與諸如ChatGpt 3.5(例如ChatGpt 3.5)相比,在理解上下文和產生連貫的響應方面取得了重大改進。未來的發展可能包括更多個性化的間

Google的Gencast:Gencast Mini Demo的天氣預報 Google的Gencast:Gencast Mini Demo的天氣預報 Mar 16, 2025 pm 01:46 PM

Google DeepMind的Gencast:天氣預報的革命性AI 天氣預報經歷了巨大的轉變,從基本觀察到復雜的AI驅動預測。 Google DeepMind的Gencast,開創性

哪個AI比Chatgpt更好? 哪個AI比Chatgpt更好? Mar 18, 2025 pm 06:05 PM

本文討論了AI模型超過Chatgpt,例如Lamda,Llama和Grok,突出了它們在準確性,理解和行業影響方面的優勢。(159個字符)

O1 vs GPT-4O:OpenAI的新型號比GPT-4O好嗎? O1 vs GPT-4O:OpenAI的新型號比GPT-4O好嗎? Mar 16, 2025 am 11:47 AM

Openai的O1:為期12天的禮物狂歡始於他們迄今為止最強大的模型 12月的到來帶來了全球放緩,世界某些地區的雪花放緩,但Openai才剛剛開始。 山姆·奧特曼(Sam Altman)和他的團隊正在推出12天的禮物前

如何將Mistral OCR用於下一個抹布模型 如何將Mistral OCR用於下一個抹布模型 Mar 21, 2025 am 11:11 AM

MISTRAL OCR:通過多模式文檔理解徹底改變檢索效果 檢索增強的生成(RAG)系統具有明顯高級的AI功能,從而可以訪問大量的數據存儲,以獲得更明智的響應

See all articles