目錄
真人和GPT-4都說好
△圖中虛線代表50%Win rate
多智能體分工協作
One More Thing
首頁 科技週邊 人工智慧 鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

Jun 02, 2024 pm 12:09 PM
ai 翻譯

鵝廠搞了個150多人的“翻譯公司”,從老闆到員工都是AI智能體#!

主營事業是翻譯網路小說,品質極高,參與評價的讀者認為比真人翻譯得還要好#。

而且比起僱用真人,用它來翻譯文學作品,成本降低了近80倍

鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

ATransAgents公司,每個職位都配備了30個不同的職工,能夠根據語言、體裁和目標受眾適配不同的翻譯風格。

相較於傳統的翻譯,產出的譯文更加靈活多樣,也更符合目標語言的表達習慣#,文學性也更強。

所以,TransAgents雖然在以相似度為基礎的自動評估中“失敗”,卻贏得了讀者和專業人士的大力肯定。

這樣的表現甚至讓人感嘆說,或許人類對人工智慧生成的內容更加青睞的時代,就要來了。

鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

仍有人表示,TransAgents是證明自己錯看了人工智慧的另一個證據——本以為由於模型限制,小說的翻譯對AI會極其困難,結果AI智能體將這個任務完成得非常好。

鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

所以,TransAgents到底有沒有那麼神呢?

真人和GPT-4都說好

為了評估TransAgents的翻譯質量,作者選擇了WMT2023資料集,需要對其進行篇章級的文學翻譯。

此資料集從12部網路小說中各截取了20個連續的章節,涉及以下八種類型:

  • 遊戲類別(Video Games,VG)
  • 東方奇幻類別(Eastern Fantasy,EF)
  • 科幻愛情類別(Sci-fi Romance,SR)
  • 當代愛情類別(Contemporary Romance,CR)
  • 奇幻類別(Fantasy,F)
  • 科幻類(Science Fiction,SF)
  • 恐怖驚悚類(Horror & Thriller,HT)
  • 玄幻愛情類(Fantasy Romance, FR)

起初,作者使用d-BLEU進行了自動評估,該方法會與參考樣本進行相似度計算,相似度越高得分也就越高。

具體到本項目當中,參考樣本一共有兩組,樣本一是人工給出的翻譯結果,樣本二是對網絡中的雙語文本進行對齊後得到。

結果,TransAgents的得分並不理想,只有25分,連SOTA的一半都不到。

鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

但這並不表示TransAgents的翻譯品質不行,而是因為用相似度來衡量文學作品翻譯的表現,本身就有失偏頗。

文學翻譯不是逐字對照,而是需要在語意、語氣、風格等方面進行創造性的轉換,這些轉換可能導致譯文與參考譯文在表面上差異較大,相似度不高自然就不意外了。

所以,作者乾脆直接讓真人(至少10人)來評價翻譯的質量,順便也讓GPT-4(0125-Preview)來看了看,在TransAgents、GPT -4(1106-Preview)和真人當中,誰的翻譯最好。

評測者會看到同一段原文的不同翻譯,其中真人只看譯文,GPT-4則是原文譯文都看。

結果,真人評測者有超過一半都認為TransAgents比人類翻譯得更好,8.4%認為兩者品質相當,GPT-4也認為TransAgents比自己(和人類)的翻譯品質高。

鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

除了這些大眾評審之外,兩位專業的翻譯也認為,雖然人工翻譯更忠於原文,但TransAgents給予的翻譯明顯更有文學色彩,更簡潔、在遣詞用句上體現了語言天賦和深厚的文學表現。

鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

MATTR和MTLD測試指標也證明了這一點,尤其是在MTLD上,TransAgents的語言多樣性比真人和GPT-4高出了三分之一左右。

鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

在作者展示的案例中,TransAgents會根據目標語言的習慣對翻譯內容做出調整,真人(Ref1)和GPT-4雖然翻的也沒錯,但相較之下不如TransAgents符合語言習慣。

鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

另外在前後一致性#上,TransAgents也超過了單純使用GPT-4,對相同的原文保持使用一樣的譯本。

鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

當然,也不是說所有類型它都擅長,在前面提到的8種類型中,TransAgents在遊戲、科幻愛情等類型上的表現突出,而在恐怖驚悚等類型上就比較平庸了。

鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

△圖中虛線代表50%Win rate

同時作者也發現,TransAgents在翻譯時並非“照單全收”,而是會出現一定程度的遺漏現象。

鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

不過從測驗中未看過原文的讀者給予的分數來看,這樣的遺漏似乎沒有影響到他們的閱讀經驗。

所以,這家「翻譯公司」是如何運作的呢?

多智能體分工協作

在這個公司當中,不同的智能體分別扮演著CEO、初/高級編輯、真·翻譯、本地化專家和校對(Proofreader )這些不同的職位,除CEO外每個職位各有30人,每個人擅長的領域也有所不同,另外還有一個Ghost Agent。

這些智能體由GPT-4-Turbo驅動,每個角色都包含姓名、年齡、職位、工作年限及掌握的語言等多維度的設定。

鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

接到「客戶」的翻譯要求後,CEO會綜合分析原文和目標語言、體裁、目標受眾等訊息,從幾位高階編輯中選擇擅長領域最匹配的一位。

此時,Ghost Agent會對CEO的選擇進行評估,告知其人選是否合適,從而減少選擇失當的現象。

被選定的高級編輯會與CEO合作,再次結合任務需求和個人特點,從公司人才庫中進一步選擇初級編輯、翻譯、本地化專家和校對等團隊成員。

鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

團隊組成好後,首先由初級編輯逐章節識別所有潛在的關鍵術語,生成初始術語表,交由高級編輯審查,刪除其中的通用術語,產生修訂後的術語表,反覆迭代直到不需要進一步修改。

然後,結合術語在不同情境下的意義,高階編輯會將術語表中的關鍵術語翻譯為目標語言。

有了術語表後,初級編輯會為每一章生成詳細的章節摘要,盡可能保留關鍵信息和細節,然後還是讓高級編輯來審查,並刪除冗餘或不必要的信息,讓章節摘要更加簡潔扼要。

接著,高級編輯根據修訂後的章節摘要編寫全書的摘要,概括主要情節、人物和主題,並隨機選擇書中的一章,分析其語氣、風格和目標受眾,制定翻譯風格指南。

翻譯風格指南會寄給專案團隊所有成員,以確保譯文風格的一致性。

根據風格指南,公司中的真·譯員會逐章節進行初步翻譯,把初稿交給初級編輯審查,檢查是否遵循翻譯風格指南,並提出改進意見。

在此基礎之上,高級編輯會評估經過修改的譯文質量,決定是否需要進一步修改,譯者、初級編輯和高級編輯反覆迭代,直到譯文質量滿足要求。

但此時得到的翻譯文字並不是終稿,還要交給在地化專家進行調整。專家會辨識可能需要文化調適的內容,如慣用語、隱喻等等,並對這些內容進行調整,使其在保留原文意圖的基礎之上更貼近目標語言和文化。

調整後的文本會讓初級編輯和高級編輯再次審查,確保譯文在文化適應性和忠實度之間取得平衡。

這之後,還有校對人員再次檢查語法、拼字、標點和格式錯誤,如果有修改,還要再讓編輯進一步審核。

這些流程都走完後,高級編輯會進行最後的終審,重點關注相鄰章節之間的連貫性,確保情節、人物、主題等元素在全書範圍內保持一致,一旦發現問題則發回給前面的團隊成員進行修改,直到形成最終的譯本。

如果客戶對譯本有修改意見,則會再次由資深編輯牽頭,組織相關人員進行修改,直到定稿。

不僅是在工作流程上極為嚴格規範,在客戶對譯本滿意後,資深編輯還會組織專案團隊「開會」進行專案總結,分享經驗教訓。

過程中累積的有價值的術語、翻譯技巧、文化調適策略等知識會被整理歸納,上傳至公司的知識庫,供後續項目參考。

One More Thing

TransAgents已經不是第一個由智能體組成的「公司」了,去年就有來自清華的「遊戲公司」ChatDev爆紅網絡,背後所運用的核心技術就是多智能體。

如果把視線放寬,不只看“公司”,還有斯坦福的AI小鎮、清華的AI狼人殺遊戲,都在使用多智能體進行著真實人類社會的模擬。

總之隨著大模型研究的深入,智能體和群體智能實驗已成AI研究最熱門方向之一,而且從這次的TransAgents來看,多智能體協同已經開始顯現出了實際效益。

(順便提一句,有網友發現,從史丹佛小鎮到ChatDev,再到這次的TransAgents,多智能體研究的作者是真的喜歡《星露穀物語》式的繪畫風格。語言中獨特的表達消失。

鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

更有甚者,已經跳出TransAgents本身,想到Ilya對大規模Agent合作的恐懼了…

鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

那麼你認為在群體智慧這條路上還能創造出什麼新奇的成果呢?歡迎在留言區曬出你的腦洞。

論文網址:https://arxiv.org/abs/2405.11804鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好

以上是鵝廠造了個AI翻譯公司:專攻網路小說,自動適配語言風格,真人和GPT-4看了都說好的詳細內容。更多資訊請關注PHP中文網其他相關文章!

本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn

熱AI工具

Undresser.AI Undress

Undresser.AI Undress

人工智慧驅動的應用程序,用於創建逼真的裸體照片

AI Clothes Remover

AI Clothes Remover

用於從照片中去除衣服的線上人工智慧工具。

Undress AI Tool

Undress AI Tool

免費脫衣圖片

Clothoff.io

Clothoff.io

AI脫衣器

Video Face Swap

Video Face Swap

使用我們完全免費的人工智慧換臉工具,輕鬆在任何影片中換臉!

熱工具

記事本++7.3.1

記事本++7.3.1

好用且免費的程式碼編輯器

SublimeText3漢化版

SublimeText3漢化版

中文版,非常好用

禪工作室 13.0.1

禪工作室 13.0.1

強大的PHP整合開發環境

Dreamweaver CS6

Dreamweaver CS6

視覺化網頁開發工具

SublimeText3 Mac版

SublimeText3 Mac版

神級程式碼編輯軟體(SublimeText3)

熱門話題

Java教學
1657
14
CakePHP 教程
1415
52
Laravel 教程
1309
25
PHP教程
1257
29
C# 教程
1231
24
比特幣值多少美金 比特幣值多少美金 Apr 28, 2025 pm 07:42 PM

比特幣的價格在20,000到30,000美元之間。 1. 比特幣自2009年以來價格波動劇烈,2017年達到近20,000美元,2021年達到近60,000美元。 2. 價格受市場需求、供應量、宏觀經濟環境等因素影響。 3. 通過交易所、移動應用和網站可獲取實時價格。 4. 比特幣價格波動性大,受市場情緒和外部因素驅動。 5. 與傳統金融市場有一定關係,受全球股市、美元強弱等影響。 6. 長期趨勢看漲,但需謹慎評估風險。

全球幣圈十大交易所有哪些 排名前十的貨幣交易平台2025 全球幣圈十大交易所有哪些 排名前十的貨幣交易平台2025 Apr 28, 2025 pm 08:12 PM

2025年全球十大加密貨幣交易所包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi、Bitfinex、KuCoin、Bittrex和Poloniex,均以高交易量和安全性著稱。

全球幣圈十大交易所有哪些 排名前十的貨幣交易平台最新版 全球幣圈十大交易所有哪些 排名前十的貨幣交易平台最新版 Apr 28, 2025 pm 08:09 PM

全球十大加密貨幣交易平台包括Binance、OKX、Gate.io、Coinbase、Kraken、Huobi Global、Bitfinex、Bittrex、KuCoin和Poloniex,均提供多種交易方式和強大的安全措施。

排名前十的虛擬幣交易app有哪 最新數字貨幣交易所排行榜 排名前十的虛擬幣交易app有哪 最新數字貨幣交易所排行榜 Apr 28, 2025 pm 08:03 PM

Binance、OKX、gate.io等十大數字貨幣交易所完善系統、高效多元化交易和嚴密安全措施嚴重推崇。

解密Gate.io戰略升級:MeMebox 2.0如何重新定義加密資產管理? 解密Gate.io戰略升級:MeMebox 2.0如何重新定義加密資產管理? Apr 28, 2025 pm 03:33 PM

MeMebox 2.0通過創新架構和性能突破重新定義了加密資產管理。 1) 它解決了資產孤島、收益衰減和安全與便利悖論三大痛點。 2) 通過智能資產樞紐、動態風險管理和收益增強引擎,提升了跨鏈轉賬速度、平均收益率和安全事件響應速度。 3) 為用戶提供資產可視化、策略自動化和治理一體化,實現了用戶價值重構。 4) 通過生態協同和合規化創新,增強了平台的整體效能。 5) 未來將推出智能合約保險池、預測市場集成和AI驅動資產配置,繼續引領行業發展。

排名靠前的貨幣交易平台有哪些 最新虛擬幣交易所排名榜前10 排名靠前的貨幣交易平台有哪些 最新虛擬幣交易所排名榜前10 Apr 28, 2025 pm 08:06 PM

目前排名前十的虛擬幣交易所:1.幣安,2. OKX,3. Gate.io,4。幣庫,5。海妖,6。火幣全球站,7.拜比特,8.庫幣,9.比特幣,10。比特戳。

靠譜的數字貨幣交易平台推薦 全球十大數字貨幣交易所排行榜2025 靠譜的數字貨幣交易平台推薦 全球十大數字貨幣交易所排行榜2025 Apr 28, 2025 pm 04:30 PM

靠谱的数字货币交易平台推荐:1. OKX,2. Binance,3. Coinbase,4. Kraken,5. Huobi,6. KuCoin,7. Bitfinex,8. Gemini,9. Bitstamp,10. Poloniex,这些平台均以其安全性、用户体验和多样化的功能著称,适合不同层次的用户进行数字货币交易

C  中的chrono庫如何使用? C 中的chrono庫如何使用? Apr 28, 2025 pm 10:18 PM

使用C 中的chrono庫可以讓你更加精確地控制時間和時間間隔,讓我們來探討一下這個庫的魅力所在吧。 C 的chrono庫是標準庫的一部分,它提供了一種現代化的方式來處理時間和時間間隔。對於那些曾經飽受time.h和ctime折磨的程序員來說,chrono無疑是一個福音。它不僅提高了代碼的可讀性和可維護性,還提供了更高的精度和靈活性。讓我們從基礎開始,chrono庫主要包括以下幾個關鍵組件:std::chrono::system_clock:表示系統時鐘,用於獲取當前時間。 std::chron

See all articles