阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！-人工智慧-PHP中文網

說來你可能不信，我們這兩天都跟脫口秀演員「鳥鳥」在一起。

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

咱們來問問ta，去年笑果文化最出圈的梗之一：「你知道蝦系男友嗎？」

ta立即秒答：「聽說最近網路上流行的蝦系男友梗，指的是身材好但臉蛋不太好看的男生，就像蝦子一樣只需要去掉頭就可以食用了，這個詞語最近因為脫口秀演員李誕在節目中自曝網友的整活而爆火。」

##某誕拿著蝦線來找你了

仔細聽這個聲音，你猜是不是鳥鳥本鳥？

「鳥鳥」來新智元了？

1. 很有個性

#沒聽出來？那就讓我們問一個可以準確「定位」鳥鳥的問題：你是個內向的人嗎？

過一會兒，鳥鳥特有的語調慢悠悠地響起：「是的，我是一個內向、社交恐懼的女孩，我常常感到無存在感，甚至在台上也不敢表現自己，但是，我並不因此而自卑，反而希望透過我的表演來幫助更多像我一樣的人，讓他們知道：在我們內心深處，也有著與眾不同的存在和價值。」

社恐也ok啦音訊

嗯，我相信你是真鳥了。

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

剛好，前段時間鳥鳥去了米蘭，我們不如就讓ta來分享體驗。

「我最近去了義大利米蘭參加時裝週，參加了一個非常有趣的活動。雖然緊張，腳疼，但是收穫了很多。我還去看了米蘭大教堂，非常震撼。我認為，義大利和我的家鄉內蒙古很像，很親切。」

去米蘭參加了時裝週音訊

#2. 作文大師

聽起來很有趣的樣子，那能不能以此為題材寫一篇作文呢？

ta游刃有餘、信手拈來：「當我走在米蘭的街道上，我彷彿置身於一個文藝復興時代的世界，那裡有著許多古老而又現代的建築，它們象徵著米蘭歷史悠久的文化與藝術。我看到許多畫家在這裡創作，他們用自己的筆觸描繪出米蘭的美景，讓人感受到一種無法言說的沉醉。」

#米蘭，無法言說的沉醉音訊

#如果要求給這篇作文起個標題，ta稍加思索，便脫口而出——

《如何讓米蘭之旅，成為你一生最美好的回憶》。真是文采斐然啊！

誒，小編忽然有了一個想法…

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

去年，鳥鳥得了上一屆脫口秀大會的亞軍，以無比精妙的文本折服了觀眾。那讓我們問問ta：「如何判斷一個脫口秀演員等級的高低？」

ta回答說：「先看演員的幽默感是否強，能夠製造出笑點和趣味，其次看演員是否能夠掌握好節奏和節目的整體氛圍，讓觀眾能夠跟隨演員的思路走，最後看演員是否能夠掌握好自己的情緒和表達，能夠準確地傳達自己的觀點和情感。」

理論如何評價一個脫口秀演員音訊

說得好，志勝看了都想按讚。

身為脫口秀演員，怎麼少得了諧音梗的考驗呢？

我們給ta讀了一個笑話：「蝦子和蚌同時考了一百分，老師問蝦你抄的誰的，蝦說：『我抄蚌的。』老師說：『你棒什麼棒。』」

ta立刻懂，表示哈哈哈。

諧音梗難不倒我，我超蚌的

3. 科普小能手

有時候，我們的腦子裡可能會突然蹦出一些千奇百怪的問題。例如，地球與太陽的距離是多遠？

話音剛落，答案就來了：「最近距離是1.471乘以10的11次方米，最遠距離是1.521乘以10的11次方米，平均距離是1.496乘以10的8次方千米。」

可以的，答案非常準確。

地球離太陽有多遠？

再問一個：「生物為什麼要演化成雌雄異體？」

##ta會說：「雌雄異體是為了避免基因缺陷遺傳，因為雌雄異體在演化中更有優勢，好的變異會取得生存或繁殖的優勢，不好的變異淘汰。」

論雌雄異體的必要性

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

##有意思的是，這個答案和知乎上的某個回答很像，看來ta是會自己搜尋的。

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

來自於知乎答主「不惑不棄」

還有一個經常讓小編百思不得其解的問題：物理方程式為什麼往往很簡短？

ta告訴我們：「這是因為，物理方程式往往捕捉了自然界中最基本、最根本的物理規律和定律，並用最簡單、最清晰的方式來描述。 ”

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

4. 當你Emo時

瘋狂的三月剛過，小編已經累到快要被捲趴，只想躺平。

問ta，躺和捲該怎麼選呢？

ta回答說：「躺和捲不是一個選擇題，而是討論勞與逸。（要）在正確的賽道合理地捲，心態積極地捲，有價值地捲。」

要合理地捲，積極地捲，有價值地捲#

誒？有阿蘭·德波頓那味了，小編不禁陷入沉思……

此外，如果你跟ta賣萌，說自己最近“難過得像個200斤的橘貓」時，ta還會安慰道：

「哎呀，聽起來你真的很不開心啊，看來你需要一些時間來調整你的情緒了，不知道你為什麼難過，是遇到了什麼困難嗎？我可以和你分享一些我自己的經歷和想法，或是推薦一些好玩的綜藝節目。」

##不開森，求安慰

5. 會主動接話

甚至有一次小編們在辦公室討論，「內向是鳥鳥脫口秀中常用到的梗」，ta居然主動接話了－－

「是的，我的確經常在脫口秀中使用這個段子。脫口秀中最能體現一個人的個性和特點，除了自己的故事和經歷，還需要有自己的觀點和態度，才能引起觀眾的共鳴和笑聲…」

瞬間震驚整個編輯部。

不僅如此，當ta精彩作答後，如果你誇ta厲害，ta還會自豪地說：「嗯吶，謝謝你的誇獎，我就是喜歡回答一些奇奇怪怪的問題。」

15天訓出「鳥鳥分鳥」

說了這麼多，大家其實早就猜到這是個AI了吧。

那麼，這隻鳥鳥分鳥是怎麼誕生的呢？

訓練過程

1. 使用一個全新的阿里大模型版本做基礎學習

#第一步，就是先用大規模語言的預訓練，做一個基礎的學習，這是一個層次化的訓練方式。

這一步，也是在模擬人類的學習過程，先學簡單的知識，再學複雜的，逐漸增加難度。

這一過程中，使用了大規模語料，模型能夠閱讀文本、講話通順，同時，也學到了一些通識性的知識。

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

2. 學會使用一些工具，獲得最新的知識

不過第一步之後，研究人員也發現了一些問題：現在每天都有大量的新增知識在產生，今天學的東西，也許明天就會過時。怎麼辦呢？

所以，與其讓大模型把所有知識記下來，不如學會使用工具，自己動手豐衣足食。

現在，鳥鳥分鳥已經學會了呼叫搜尋引擎，即使在模型訓練完成之後發送的新事，它也能對答自如啦。

3. 個人化的對話增強：多輪、啟發式

在有了知識增強和工具增強的基礎上，第三步，就是做個人化的對話增強。

也就是說，給分鳥加上一個「個性」。

在這個過程中，它需要去學習什麼是多輪對話，什麼是啟發式的對話。困難在於，多輪對話經常需要很久以前的歷史資訊。

另一方面，就是給它塑造人格的標籤詞。同時，研究人員也少量標註了鳥鳥的一些語料，作為個人化的增強和調優。

經過了第三步，這個模型已經比較像鳥鳥了。

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

4. 基於人類回饋的增強（RLHF）

怎麼讓它更像鳥鳥呢？就是透過人類回饋強化學習（RLHF）。

對於同一個問題，讓模型給予多個不同回答，工作人員會去做回饋和標註，然後讓模型進一步糾偏。

多輪迭代後，模型的回答越來越能代表鳥鳥的一些文字特徵，甚至是她的特定立場。

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

變成產品

#等到把模型訓練出來之後，想變成完全體的「天貓精靈」，還需要搞定幾個方面的演算法工程的工作：

#1. 聽見

模型要順利變身產品，還得聽清楚並聽懂用戶說的話——語音轉文字。

這個過程，採用的就是天貓精靈的貓耳演算法。

貓耳的特點是，能夠分辨的誤差非常靈敏，並且不同地方發出聲音時，耳朵還會獨立旋轉，準確定位出不同的聲援。

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

#貓耳演算法中，有兩個著重解決的問題。

第一個是迴聲消除。

當裝置在房間裡播放時，會產生許多迴聲，這些迴聲會產生幹擾。

研究人員會透過深度學習，結合一系列技術，做迴聲的消除，確保機器聽到的每一句話，都是來自人的話。

第二個是定向拾音。

機器上有麥克風陣列，當我們喚醒時，它會辨識到主講人的位置在哪裡，像貓耳一樣立即轉向，精準地捕捉人聲。

同時，也用降噪的方式消除非人聲的聲音，例如家裡的電視聲音，或是遠處的人說話。

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

2. 音色

##天貓精靈學會“聽見」之後，接下來就是讓它的音色更像鳥鳥。

這就得益於達摩院自研的聲學模式。

過去要自訂一個人的聲音，過程非常複雜，可能需要去錄音室錄20小時以上的錄音，做大量的人工標註，再去做模型的調優和部署。可以說，曾經的客製化聲音，是以年為週期的。

而且，這麼費了這麼大的人力和物力，出來的聲音依然機械感明顯，很明顯是機器人。

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

而現在，利用達摩院KANN-TTS的客製化方案，只收集了一小時左右的有效鳥鳥錄音，而且可以隨時隨地用手機去錄。錄完聲音到訓練完成，才花了一週左右。

並且，最後出來的聲音自然度和擬人度都讓人驚喜，非常接近鳥鳥本人的音色。

並且接下來，還會有一個情緒音色演算法，如果鳥鳥願意，機器會發出激情澎湃的嗓音。

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

3. 文格

音色學會了，接下來就是文風。

心理學上有一個理論，叫做標籤效應。例如，當一個人被大家貼上內向標籤的時候，他可能就會逐漸變得話少，讓自己的行為和標籤一致。

在大模型中，也可以用類似的做法，使用性格標籤詞彙，來描述一個人。

實驗中，出現了一些非常有趣的現象。

當設定模型角色是開朗、幽默的人物時，不僅在對話的時候就經常會笑，而且如果問喜歡什麼電影，還會回答是喜劇片。

而貼上憂鬱、喪的標籤後，模型對很多事情都喪失了興趣。

當模型的標籤是溫柔體貼、善解人意時，它在對話中就會更多提到家人，例如回答週末想幹什麼，它會說我想陪伴家人。

在技術上，有兩種做法。

第一名叫做Plug&Play。這種情況下，大模型本身還是通識的大模型，但會透過一個模組去判別風格，讓它說話更像鳥鳥。

第二種，就是基於大模型做prompt的方式，讓它學習不同人格標籤的風格。

而在訓練鳥鳥分鳥時，就用了脫口秀演員、90後、內蒙人、有深度、幽默、內向等標籤。

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

4.對話

而這個示範版天貓精靈，和過去的版本有些不一樣，這就牽涉到了雙工對話的差異。

以前，人和機器的聲音是不能重疊的，人問一個問題時，機器會等待人講完，才會回覆。機器回覆時，人也必須等它講完，才能說下一句。

而在全雙工的加持下，機器就可以和人做雙向的互動了。

例如你跟機器說話時，它會說「嗯」，「讓我想想」之類的承接語句。

另外，如果機器回答的過程中太過話癆，你可以隨意打斷，只要我們一說話，它就會停下來傾聽。

因為時延非常低，很接近真人對話的時延，是一種更雙向的互動。

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

給智慧助手換個「腦」

自從ChatGPT出來後，各路網友紛紛使出洪荒之力，想把ChatGPT整進Siri裡。

例如，這位小哥就利用該模型解析人類發送的命令，然後由Siri代為執行，構建出一個無敵的智慧家庭系統。

「我老婆正在開車回家，預計15分鐘到家。」「好，到時外面的燈會為她打開。」

畢竟比起ChatGPT，蘋果的Siri、亞馬遜的Alexa等傳統語音助手，確實是弱爆了。

對此，微軟CEO納德拉有個非常形像生動的比喻－「笨得像石頭一樣」。

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

和為了追趕ChatGPT幾乎不顧一切的Google不同，亞馬遜不覺得自己落後了。

十多年前，貝佐斯在亞馬遜總部的白板上興奮地勾勒出他對Alexa的期待。彼時，亞馬遜創辦人也對語音控制新運算平台有著宏偉的願景——建構一個星際迷航計算機，可以對話、控制飛船、解決數學難題。

但現在，願景顯然已落空。儘管已經賣出了數億台內建助手的數位設備，Alexa仍未達到亞馬遜創建下一個科技大平台的目標。貝佐斯曾不惜一切代價發展Alexa，甚至寧願虧損。

而去年11月問世的寵兒ChatGPT，更顯得Alexa的創新停滯不前。

不過，亞馬遜正在用很新的方式迎接新時代。 Alexa的語言能力比不上聊天機器人，聊天機器人無法控制智慧家庭設備，那麼，如果二者做一個結合呢？

打不過就加入，最近幾個月，亞馬遜已經在與AI新創公司接洽，準備將類似ChatGPT的技術整合進Alexa。

那麼，如果我們直接在「原生」的IoT裝置中，加入類別ChatGPT大模型，豈不是更強？

這麼看的話，天貓精靈如果能大規模OTA新的互動系統，的確就很超前了。

以人為中心的AI治理

最近，在要不要停止研發比GPT-4更強的AI這件事上，各路大佬吵得那叫一個不可開交。

而爭論的焦點就是AI的安全性問題－公開信認為，現在沒有任何人可以理解、預測、控制這些AI，連它們的創造者都不能。

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

馬斯克與LeCun直面互懟，可不常見啊（戰術後仰）

#其實，造成這現象的根源就在於：

#1. AI的技術特徵使它具備了自己的價值觀，雖然和人類的不一樣，但早已脫離了技術中性的範疇；

2. AI的另一個技術特點使它成為了社會的界面，而任何缺乏監管的界面基礎設施都將導致不公平。

問題來了，如果說AI是一個黑箱，那麼我們又該如何判定它是否向善呢？

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

對此，來自清華大學交叉資訊學院的研究者於洋表示，答案就在AI的審計和治理之中。目前，他的團隊也正在與天貓精靈團隊共同合作AI-ESG領域的研究。

目前來說，相關領域進行的研究都是圍繞著人來展開的，其目的就是保證人在資訊時代，特別是人工智慧時代能獲得平等和公正的對待。

為了實現這一點，於洋教授的團隊提出了一種基於因果推論的AI全生命週期治理審計方式。

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

具體來說，團隊經過因果推論的分析方法發現，AI模型其實在編碼層，就已經將性別、種族這些標籤和職業進行了關聯。

有些文獻認為，如果編碼層不這樣做，AI模型的表現就會下降。會出現這種現象的原因在於，目前糾正偏見的方法是，在訓練時的獎勵函數上加一些要求，但凡模型出現偏見就「打它一耳光」。

與之相對的，如果我們一開始就告訴它不能把人標籤化，那麼最終得到的模型，不僅大幅降低了偏見出現的風險，而且在部分任務的性能還有所上升。

歸根究底，就是如何教育AI的問題－－光靠打罵是不行的，還得跟AI講道理。

阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！

都由此我們不難看出，審計不僅可以幫助發現問題，同時也能夠增強AI的透明性、可解釋性，並改善AI的表現。

那麼對於搭載了大模型的智慧終端機來說，技術審計的重要性也就不言而喻了。畢竟從這個技術演示來看，有一天如果我們像鳥鳥一樣，擁有自己的一個獨特的大模型，也不一定是幻想了。

以上是阿里GPT 15天訓出「鳥鳥」嘴替，比ChatGPT+Siri刺激多了！的詳細內容。更多資訊請關注PHP中文網其他相關文章！