文|鄰章
一直以來,用AI工具進行文學創作都是科技公司們樂於嘗試的事情,特別是在如「高考」這種全民關注的特殊時間節點,用AI撰寫高考作文等就更被科技公司追捧。
今年,明爭暗鬥或更勝以往。
核心原因當然是自去年Open AI以生成式AI應用ChatGPT以近乎於質變的能力,引發全球生成式AI大模型狂熱,讓大家公認AI技術來到了“iPhone”時刻。
國內科技網路公司們也紛紛跟進並在今年拿出了自家的生成式AI大模型產品—— 據不完全統計:從今年二月至今,國內AI大模型發布會就開了接近20場,諸如百度文心一言、阿里巴巴通義千問、科大訊飛星火大模型等,並都幾乎對外宣稱自家產品技術具備領先性。
在此,「高考作文」這一綜合考驗考生材料理解能力、文字功底、思辨能力、文字創新能力的綜合考題,無疑也是檢驗各家大模型技術創造能力的試金石。
也正是基於此,投身於生成式AI大模型的廠商們,也是摩拳擦掌,準備一展自家生成式AI大模型的文學創作能力。
諸如週鴻礪在微博就分享了一篇由360智腦創作的今年全國甲捲高考作文。
但從最終結果來看,其表現是基本功不錯但在思辨性層面則不足,也較難拿到高分。
語文特級教師王大績在微博中對360智腦生成的這篇AI作文點評稱:「作文語言曉暢,層次清晰,寫作基本功很好,在基礎等級的層面,表現不錯。作文也談到了高科技,但是對科技發展條件下,本應成為時間的主人,何以卻成為時間的僕人,未能抓住關鍵,思考不夠透徹,因此未形成鞭闢入裡的辨析,題目所要求的時代感比較淡泊,在發展等級方面,表現一般。 ”
事實上,這種在文學創作層面思辨性不足的現實,不只360智腦一家,其實幾乎是當前生成式AI大模型的「通病」。
在搜狐科技以高考作文全國卷(甲)為題,對百度文心一言、阿里通義千問、科大訊飛星火認知大模型、360智腦、ChatGPT五款主流大語言模型產品進行同題測試,並邀請到五位語文名師進行點評各模型生成作文水平的活動中,就不難發現:五款大模型基本都理解到了高考作文全國卷(甲)的作文立意,沒有出現偏題、離題現象,也都能在短時間內產生對應文章。
但同時大模型們也存在著對作文具體要求理解不清(諸如創作的文章字數未達到不少於800字的要求)、行文死板、割裂感明顯、語言空洞、「理工味」明顯;並且更為重要的是它們創作的文章,都普遍存在著論點論據不足、觀點不新穎等在文學創作上最為致命的問題,這也導致這五款大模型創作的高考作文,綜合得分最高的ChatGPT,也只拿到了48分。
坦率來講,ChatGPT的48分和百度文心一言的46.5分,在高考作文得分中,其實也不算低,甚至可能會超過許多考生的作文得分,但也與優秀作文沒有沾不上邊,只能說是較普通的水準。
而這些大模型在文學創作上暴露出的這些問題,也讓我們看到當前生成式AI技術的不足,甚至可以說,那些叫囂著現在ChatGPT等生成式AI技術就能進行文學創作,取代創意人員的話語,著實有些誇大其辭乃至危言聳聽了。
當然,我們也不否認ChatGPT等生成式AI技術在持續養料餵養下,能夠迅速成長的潛力,但要擺脫當前大模型在文學創作中存在的創造性不足問題,可能也並不是大模型們一朝一夕就能搞定的事情,其可能還需要較長的時間。
在此,幾乎可以說:在看過用生成式AI作答的高考作文後,我認為對AI取代文學創作的鼓吹也好,恐懼也罷,其實都可以暫時先緩一緩了。
#ChatGPT等大模型技術所具備的郵件&新聞&論文撰寫、視頻腳本、文案、翻譯、代碼編寫等能力,讓生成式AI技術在很大程度上超越了過往這類AI應用偏娛樂的屬性,進入了真正的生產力乃至是創造性階段。
由此也有不少業界驚呼 : 創意工作機會,可能會被GPT們率先取代了,開始陷入悲觀預期。
事實上,對於生成式AI技術展現出的實力,我一直以來的觀點都是:既沒必要過度鼓吹,同時也沒必要過度恐懼,以一顆平常心去對待技術的發展更迭,或許會更好。
站在科技浪潮面前,我們更該做的事情是,及早的學會善用這些技術,以助力我們工作效率與生活品質的提升。
作者:鄰章【微信:ZLxgic,公眾號:TMT317】,專註解讀產業發展趨勢與公司產品服務。數位化、AI、雲端運算、公司財報、智慧硬體、消費創新是關注重點。
以上是看完大模型們作答的高考作文,對AI的鼓吹與恐懼皆可緩慢了的詳細內容。更多資訊請關注PHP中文網其他相關文章!