鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好
鵝廠搞了個150多人的“翻譯公司”,從老闆到員工都是AI智能體#!
主營事業是翻譯網路小說,品質極高,參與評價的讀者認為比真人翻譯得還要好#。
而且比起僱用真人,用它來翻譯文學作品,成本降低了近80倍。
ATransAgents公司,每個職位都配備了30個不同的職工,能夠根據語言、體裁和目標受眾適配不同的翻譯風格。
相較於傳統的翻譯,產出的譯文更加靈活多樣,也更符合目標語言的表達習慣#,文學性也更強。
所以,TransAgents雖然在以相似度為基礎的自動評估中“失敗”,卻贏得了讀者和專業人士的大力肯定。
這樣的表現甚至讓人感嘆說,或許人類對人工智慧生成的內容更加青睞的時代,就要來了。
仍有人表示,TransAgents是證明自己錯看了人工智慧的另一個證據——本以為由於模型限制,小說的翻譯對AI會極其困難,結果AI智能體將這個任務完成得非常好。
所以,TransAgents到底有沒有那麼神呢?
真人和GPT-4都說好
為了評估TransAgents的翻譯質量,作者選擇了WMT2023資料集,需要對其進行篇章級的文學翻譯。
此資料集從12部網路小說中各截取了20個連續的章節,涉及以下八種類型:
- 遊戲類別(Video Games,VG)
- 東方奇幻類別(Eastern Fantasy,EF)
- 科幻愛情類別(Sci-fi Romance,SR)
- 當代愛情類別(Contemporary Romance,CR)
- 奇幻類別(Fantasy,F)
- 科幻類(Science Fiction,SF)
- 恐怖驚悚類(Horror & Thriller,HT)
- 玄幻愛情類(Fantasy Romance, FR)
起初,作者使用d-BLEU進行了自動評估,該方法會與參考樣本進行相似度計算,相似度越高得分也就越高。
具體到本項目當中,參考樣本一共有兩組,樣本一是人工給出的翻譯結果,樣本二是對網絡中的雙語文本進行對齊後得到。
結果,TransAgents的得分並不理想,只有25分,連SOTA的一半都不到。
但這並不表示TransAgents的翻譯品質不行,而是因為用相似度來衡量文學作品翻譯的表現,本身就有失偏頗。
文學翻譯不是逐字對照,而是需要在語意、語氣、風格等方面進行創造性的轉換,這些轉換可能導致譯文與參考譯文在表面上差異較大,相似度不高自然就不意外了。
所以,作者乾脆直接讓真人(至少10人)來評價翻譯的質量,順便也讓GPT-4(0125-Preview)來看了看,在TransAgents、GPT -4(1106-Preview)和真人當中,誰的翻譯最好。
評測者會看到同一段原文的不同翻譯,其中真人只看譯文,GPT-4則是原文譯文都看。
結果,真人評測者有超過一半都認為TransAgents比人類翻譯得更好,8.4%認為兩者品質相當,GPT-4也認為TransAgents比自己(和人類)的翻譯品質高。
除了這些大眾評審之外,兩位專業的翻譯也認為,雖然人工翻譯更忠於原文,但TransAgents給予的翻譯明顯更有文學色彩,更簡潔、在遣詞用句上體現了語言天賦和深厚的文學表現。
MATTR和MTLD測試指標也證明了這一點,尤其是在MTLD上,TransAgents的語言多樣性比真人和GPT-4高出了三分之一左右。
在作者展示的案例中,TransAgents會根據目標語言的習慣對翻譯內容做出調整,真人(Ref1)和GPT-4雖然翻的也沒錯,但相較之下不如TransAgents符合語言習慣。
另外在前後一致性#上,TransAgents也超過了單純使用GPT-4,對相同的原文保持使用一樣的譯本。
當然,也不是說所有類型它都擅長,在前面提到的8種類型中,TransAgents在遊戲、科幻愛情等類型上的表現突出,而在恐怖驚悚等類型上就比較平庸了。
△圖中虛線代表50%Win rate
同時作者也發現,TransAgents在翻譯時並非“照單全收”,而是會出現一定程度的遺漏現象。
不過從測驗中未看過原文的讀者給予的分數來看,這樣的遺漏似乎沒有影響到他們的閱讀經驗。
所以,這家「翻譯公司」是如何運作的呢?
多智能體分工協作
在這個公司當中,不同的智能體分別扮演著CEO、初/高級編輯、真·翻譯、本地化專家和校對(Proofreader )這些不同的職位,除CEO外每個職位各有30人,每個人擅長的領域也有所不同,另外還有一個Ghost Agent。
這些智能體由GPT-4-Turbo驅動,每個角色都包含姓名、年齡、職位、工作年限及掌握的語言等多維度的設定。
接到「客戶」的翻譯要求後,CEO會綜合分析原文和目標語言、體裁、目標受眾等訊息,從幾位高階編輯中選擇擅長領域最匹配的一位。
此時,Ghost Agent會對CEO的選擇進行評估,告知其人選是否合適,從而減少選擇失當的現象。
被選定的高級編輯會與CEO合作,再次結合任務需求和個人特點,從公司人才庫中進一步選擇初級編輯、翻譯、本地化專家和校對等團隊成員。
團隊組成好後,首先由初級編輯逐章節識別所有潛在的關鍵術語,生成初始術語表,交由高級編輯審查,刪除其中的通用術語,產生修訂後的術語表,反覆迭代直到不需要進一步修改。
然後,結合術語在不同情境下的意義,高階編輯會將術語表中的關鍵術語翻譯為目標語言。
有了術語表後,初級編輯會為每一章生成詳細的章節摘要,盡可能保留關鍵信息和細節,然後還是讓高級編輯來審查,並刪除冗餘或不必要的信息,讓章節摘要更加簡潔扼要。
接著,高級編輯根據修訂後的章節摘要編寫全書的摘要,概括主要情節、人物和主題,並隨機選擇書中的一章,分析其語氣、風格和目標受眾,制定翻譯風格指南。
翻譯風格指南會寄給專案團隊所有成員,以確保譯文風格的一致性。
根據風格指南,公司中的真·譯員會逐章節進行初步翻譯,把初稿交給初級編輯審查,檢查是否遵循翻譯風格指南,並提出改進意見。
在此基礎之上,高級編輯會評估經過修改的譯文質量,決定是否需要進一步修改,譯者、初級編輯和高級編輯反覆迭代,直到譯文質量滿足要求。
但此時得到的翻譯文字並不是終稿,還要交給在地化專家進行調整。專家會辨識可能需要文化調適的內容,如慣用語、隱喻等等,並對這些內容進行調整,使其在保留原文意圖的基礎之上更貼近目標語言和文化。
調整後的文本會讓初級編輯和高級編輯再次審查,確保譯文在文化適應性和忠實度之間取得平衡。
這之後,還有校對人員再次檢查語法、拼字、標點和格式錯誤,如果有修改,還要再讓編輯進一步審核。
這些流程都走完後,高級編輯會進行最後的終審,重點關注相鄰章節之間的連貫性,確保情節、人物、主題等元素在全書範圍內保持一致,一旦發現問題則發回給前面的團隊成員進行修改,直到形成最終的譯本。
如果客戶對譯本有修改意見,則會再次由資深編輯牽頭,組織相關人員進行修改,直到定稿。
不僅是在工作流程上極為嚴格規範,在客戶對譯本滿意後,資深編輯還會組織專案團隊「開會」進行專案總結,分享經驗教訓。
過程中累積的有價值的術語、翻譯技巧、文化調適策略等知識會被整理歸納,上傳至公司的知識庫,供後續項目參考。
One More Thing
TransAgents已經不是第一個由智能體組成的「公司」了,去年就有來自清華的「遊戲公司」ChatDev爆紅網絡,背後所運用的核心技術就是多智能體。
如果把視線放寬,不只看“公司”,還有斯坦福的AI小鎮、清華的AI狼人殺遊戲,都在使用多智能體進行著真實人類社會的模擬。
總之隨著大模型研究的深入,智能體和群體智能實驗已成AI研究最熱門方向之一,而且從這次的TransAgents來看,多智能體協同已經開始顯現出了實際效益。
(順便提一句,有網友發現,從史丹佛小鎮到ChatDev,再到這次的TransAgents,多智能體研究的作者是真的喜歡《星露穀物語》式的繪畫風格。語言中獨特的表達消失。
論文網址:https://arxiv.org/abs/2405.11804
以上是鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好的詳細內容。更多資訊請關注PHP中文網其他相關文章!

熱AI工具

Undresser.AI Undress
人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover
用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool
免費脫衣圖片

Clothoff.io
AI脫衣器

Video Face Swap
使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱門文章

熱工具

記事本++7.3.1
好用且免費的程式碼編輯器

SublimeText3漢化版
中文版,非常好用

禪工作室 13.0.1
強大的PHP整合開發環境

Dreamweaver CS6
視覺化網頁開發工具

SublimeText3 Mac版
神級程式碼編輯軟體(SublimeText3)

比特幣的價格在20,000到30,000美元之間。 1. 比特幣自2009年以來價格波動劇烈,2017年達到近20,000美元,2021年達到近60,000美元。 2. 價格受市場需求、供應量、宏觀經濟環境等因素影響。 3. 通過交易所、移動應用和網站可獲取實時價格。 4. 比特幣價格波動性大,受市場情緒和外部因素驅動。 5. 與傳統金融市場有一定關係,受全球股市、美元強弱等影響。 6. 長期趨勢看漲,但需謹慎評估風險。

2025年全球十大加密貨幣交易所包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi、Bitfinex、KuCoin、Bittrex和Poloniex,均以高交易量和安全性著稱。

全球十大加密貨幣交易平台包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi Global、Bitfinex、Bittrex、KuCoin和Poloniex,均提供多種交易方式和強大的安全措施。

Binance、OKX、gate.io等十大數字貨幣交易所完善系統、高效多元化交易和嚴密安全措施嚴重推崇。

MeMebox 2.0通過創新架構和性能突破重新定義了加密資產管理。 1) 它解決了資產孤島、收益衰減和安全與便利悖論三大痛點。 2) 通過智能資產樞紐、動態風險管理和收益增強引擎,提升了跨鏈轉賬速度、平均收益率和安全事件響應速度。 3) 為用戶提供資產可視化、策略自動化和治理一體化,實現了用戶價值重構。 4) 通過生態協同和合規化創新,增強了平台的整體效能。 5) 未來將推出智能合約保險池、預測市場集成和AI驅動資產配置,繼續引領行業發展。

目前排名前十的虛擬幣交易所:1.幣安,2. OKX,3. Gate.io,4。幣庫,5。海妖,6。火幣全球站,7.拜比特,8.庫幣,9.比特幣,10。比特戳。

靠谱的数字货币交易平台推荐:1. OKX,2. Binance,3. Coinbase,4. Kraken,5. Huobi,6. KuCoin,7. Bitfinex,8. Gemini,9. Bitstamp,10. Poloniex,这些平台均以其安全性、用户体验和多样化的功能著称,适合不同层次的用户进行数字货币交易

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron
