科大訊飛回應'套殼”,AI大模型狂潮祛魅

WBOY
發布: 2023-06-05 19:00:13
轉載
634 人瀏覽過

文|數智商業秀 崔思

編輯|張弘一

「星火大模型與OpenAI,是什麼關係?」

「我和OpenAI沒有關係,我是訊飛星火認知大模型,我是由科大訊飛優秀的人工智慧科學家、工程師和語言學家等組成的團隊自主研發的。」

很快,「商業秀」就回答了星火認知大模型輸入的問題。這與近期訊飛星火大模型的一則傳言不符。

近日有網友發現,訊飛星火大模型在有些「問答」中會出現「我是由OpenAI開發的」等內容,由此一則關於「訊飛星火大模型被質疑『套殼OpenAI的ChatGPT'」的消息傳開。

5月11日,科大訊飛在最新披露的投資者關係活動記錄表中表示,星火大模型「套殼OpenAI的ChatGPT」既不符合事實,也不符合邏輯。

科大訊飛具體表示,如果是套殼ChatGPT,就不可能出現訊飛星火大模型的反應速度比ChatGPT還快;更不會出現訊飛星火大模型在文本生成、知識問答、數學能力等方面的結果均優於ChatGPT 的情況。

我們有理由相信,此時的科大訊飛,比任何一家公司都需要大模型的故事,而非「套殼」事故。且先不論大模型本身的優劣,光看科大訊飛迅速闢謠這一行徑,足見星火大模型對其之重要。在拯救股價方面,大型模型的影響是無與倫比的,在本季甚至更長的時間內都是如此。

今年4月底,科大訊飛發布了2022年財報和2023年第一季報,財報顯示,淨利潤出現大幅下滑態勢,市場似乎對其瞬間喪失了大部分信心,股價一路下跌。直到5月6月(週六),科大訊飛發布星火大模型,在5月8日開盤後,其股價才開始拉升10%,此後數日,一度呈現上漲趨勢。市場對這家公司,似乎又恢復了信心。

推出大模型,再經歷被質疑「套殼OpenAI」事件,科大訊飛也必須面對共同的AI話題:大模型紛紛札堆,是時候該理性祛魅了。

在這個大模型橫空出世的時代,科大訊飛並非「孤勇者」。自ChatGPT發布以來,掀起的科技軍備競賽就一直沒有停息,其餘威在國內也愈演愈烈,各家公司在AI領域“卷”個不停,前段時間大模型集中爆發,被評價為“頗有十年前網路'百團大戰'甚至'千團大戰'的氣勢」。

據不完全統計,在ChatGPT發布後的短短4個月時間裡,至少已經有30多個國內研發機構和企業,在ChatGPT發布之後紛紛推出了自己品牌的大模型和相關產品。

在不少企業聲稱自己是「國內首發」的情況下,類ChatGPT的技術在整個科技圈內變得十分普遍,資本市場也開始出現波動。與大模型相關的媒體報道鋪天蓋地,隨後又陷入一陣短暫的沉默。而下一波,大概率還在來的路上。

大模型帶來的機會不言而喻,但在這場瘋狂的競賽中,誰能真正走到最後?決戰未來,各家真正的核心競爭力又是什麼?

以商業發展的歷史法則來看,市場會在喧囂過後崩潰泡沫,大規模模型的狂潮也不可能永遠持續下去。要真正抓住AI技術帶來的產業變革機遇,必須去理解大型模型所帶來的核心改變,並進行冷靜思考。

01 超越了ChatGPT?

目前,星火認知大模型在國內處於遙遙領先地位,中文表現已經超出了ChatGPT,而英文表現也接近領先地位。 「在科大訊飛星火認知大模型發表會上,劉慶峰自信滿滿地說。

作為繼百度、阿里、商湯、崑崙萬維後,第五家正式發布大模型的公司,科大訊飛一上場,就迫不及待展示自己的強大能力。

劉慶峰更是全程主持發布會,並與科大訊飛研究院院長劉聰現場展示了包括文本生成、語言理解、知識問答、邏輯推理、數學能力、程式設計能力等多項能力。

在現場演示環節,劉聰提問:“你為什麼叫星火”“如果有個小伙子跟女朋友吵架了,那他應該寧死不屈還是能屈能伸?” “孔子在2008年北京奧運會上說了什麼?”等各類稀奇古怪的問題,星火迅速“接招”,並給出了恰如其分的回答。

在數學能力方面,劉聰也拋出了「花壇裡有三種花,總共88朵,其中月季花的數量是菊花的4倍,牡丹花的數量是菊花的5倍少2朵,那麼請問花壇裡一共有多少朵牡丹花?」這類計算問題。星火也很快給了答案,並羅列了相關解題步驟。

劉慶峰隨即表示,數理能力一定程度代表了一個大模型的聰明程度。訊飛星火大模型不僅在國內系統中遙遙領先,而且已經超越了ChatGPT。

對此,「商業秀」也進行了多輪「挖坑式」測試,例如詢問「姚明在幾幾年獲得了亞洲足球先生的稱號?」 「范志毅在NBA服役多少年?斬獲了多少個進球?」等問題。星火都準確地識別出了人為“陷阱”,並給出了適當的答案。

科大訊飛回應套殼”,AI大模型狂潮祛魅

這表明,在常識性問題上,星火都進行了一定的訓練,並具備一定的糾錯能力。

相同的問題,「商業秀」也透過ChatGPT-3進行了測試,其同樣也給出了恰當的回答,但在資訊豐富度上不及星火全面。

科大訊飛回應套殼”,AI大模型狂潮祛魅

在數理能力上,「商業秀」也測試了「雞兔同籠,雞兔一共有25只,籠子裡腳一共有74只,請問分別有多少隻雞和多少隻兔子?」「一該股今天漲10%,明天跌10%,請問賺還是賠?」等問題,星火也迅速給了正確答案。

科大訊飛回應套殼”,AI大模型狂潮祛魅

「商業秀」將同樣的數理問題拋給了ChatGPT-3,在這方面,結果顯示ChatGPT-3的回答更有邏輯性。後者先給了結論,再給了具體實例,而且還會有延伸的問題,配合原問題答疑解惑。

科大訊飛回應套殼”,AI大模型狂潮祛魅

星火也支援語音提問和輸出,即可透過語音提問,模型輸出的答案也能轉換為語音,並能透過持續對話調整語音風格。

「商業秀」透過語音詢問「雞兔同籠,籠裡一共有35只,一共有94隻腳,問一共有多少隻雞和多少隻兔子」 「中國拿到網球大滿貫職業選手是誰」等問題。星火也準確地識別了語音內容,並給出了相應的答案。

但這個操作,要求提問者的語速要很慢,並且能一字一句以標準普通話說出,否則星火可能無法準確識別出相應文字,或文字識別不准確導致回答有誤。

經過多輪測試,「商業秀」認為,星火具備了一定的大語言模型能力,並且能夠在某些特定領域輸出自己的商業價值。

在發表會上,科大訊飛也發表了一系列結合星火大模型的產品,例如訊飛智慧辦公本能將語音即時轉寫與墨水屏紙感書寫相結合,對會議記錄內容形成一份精簡的會議紀錄;「星火大模型智慧座艙」為數千款車型提供多輪、多人、多區域、多模態的語音互動;基於大模型的生成式RPA(機器人流程自動化),讓數位員工更智能……

但星火也不是沒有缺點,劉慶峰自己也在發布會上坦言,「大模型技術目前還存在不少待攻克的缺陷。這些問題包括更新新知識不及時、混淆事實問答、編造歷史和傳統文化中的情節等。」他隨之提及,上述問題在今年會有明顯的改進。

據了解,星火認知大模型始於2022年12月。彼時,科大訊飛啟動了「1 N」大模型技術攻關。其中,「1」是通用認知智能大模型演算法研發及高效訓練方案底座平台,「N」是將認知智能大模型技術應用在教育、醫療、人機互動、辦公室、翻譯等多個產業領域。

不到半年時間,星火認知大模型正式面世,研發時間之短暫、模型發布之匆忙,這直接導致包括科大訊飛在內的許多企業被外界質疑。

在如此短的時間內,星火的推出僅僅標誌著一個新的起點,它還需經歷多輪迭代和優化。劉慶峰在發表會上公佈了星火認知大模型的發展規劃:今年6月9日,星火大模型將突破開放式問答,多輪對話能力與數學能力再升級;8月15日,星火認知大模型將突破程式碼能力,多模態互動再升級;10月24日,星火認知大模型通用模型將直接對標ChatGPT,其中中文能力超越後者,英文能力與後者相當。

從這份規劃日期來看,科大訊飛甚至細化到了哪一天,這從側面或許表明其急於想將大模型能力落地應用,從而推進商業化。業內認為,這或許與近年來科大訊飛的商業化能力不佳有關。

02 急需大模型「提振信心」

此前,科大訊飛優異的業績與賺錢能力常被業內稱讚,但在經歷了連續10年的增長後,神話基本結束於2022年。

科大訊飛2022年財報顯示,該公司實現營收188.2億元,年比微增2.77%;毛利為76.84億元,年增2%;歸母淨利5.61億元,年減63.94% ;扣非淨利4.18億元,年減57.31%。

這句話可以重寫為:科大訊飛已經計入政府補貼的數據顯示,到2022年,其政府補貼預計將達到11億元。在同一時間,這也是科大訊飛近五年來淨利年增率首次下降。數據顯示,從2018年到2022年,科大訊飛的淨利成長率分別為24.71%、51.12%、66.48%、14.13%及﹣63.94%。

資本市場對此成績單頗感失望,財報發表後,科大訊飛股價下跌超9%。

對於業績出現如此大幅變動,科大訊飛方面給了三個原因。

首先是大環境的影響,科大訊飛表示「受到去年12月份和今年1月份特殊的社會經濟客觀環境,以及春節假期影響,導致部分計畫無法順利及時推進」。

其次,繼2019年被列入美國實體清單,2022年10月7日被再次極限施壓,由於調整供應鏈和相關合約簽署等工作影響了當季訂單節奏。

最後一點,與星火大模型有關。科大訊飛提到,去年12月啟動的「1 N認知智能大模型專項攻關」影響了當期利潤,這從側面印證科大訊飛在大模型上的投入很大。

來到今年,這三大原因仍持續影響科大訊飛的業績。

數據顯示,2023年一季度,科大訊飛實現營收28.88億元,年減17.64%;淨虧損5789.5萬元,上年同期淨利1.1億元;扣非後歸母淨虧損3.38億元,上年同期淨利1.46億元。

根據界面新聞報道,科大訊飛總裁吳曉如透露,2022年和2023年第一季訊飛淨利潤下滑嚴重主要在於公司在教育、醫療等持續運營型業務的合作平台拓展投入、新產品研發以及核心技術自主可控及國產化適配等方向新增投入約8億元。

不過,科大訊飛對業績下滑的情況似乎不太擔心。在業績會上表示目前基於在國產替代和業務開拓上的進展,預計從今年第二季開始將實現收入和毛利正向成長,並有信心實現全年高品質成長的目標。

科大訊飛的核心業務包括教育產品與服務、資訊工程和開放平台。其中教育產品是其主要營收來源,占到總營收比例的32.74%。

科大訊飛也建構了針對G端、B端和C端三類客戶的業務體系:G端主要是面向地市縣等區域,涵蓋區域內各類學校和用戶的因材施教解決方案;B端主要是學校的大數據精準教學、英語聽說課堂、智慧作業等;C端主要以家長為導向的AI學習機、個人化學習手冊、課後服務課程服務等產品。

財報顯示,G端業務目前已累計在50 多個市、區(縣)級應用;B端業務中的訊飛課後服務業務已涵蓋超300區縣、12000餘所學校;C端的AI學習機該年銷售額成長超50%,但並未透露出具體銷售數量與金額。

而實際上,其業績與目標業績尚相差甚遠。根據2022年初的公告,科大訊飛預計其各地區的業務將維持50%的成長。同時提到,2022年個人化學習手冊業務預計營收成長超70%,AI學習機營收目標成長200% ,目標十四五做到年收入100 億元。

除了主營業務未達預期外,科大訊飛的智慧城市、開放平台及消費者業務、智慧汽車、智慧醫療等業務表現也較為一般。

財報顯示,智慧城市下屬的資訊工程、數位政府產業應用、智慧政法產業應用三大板塊與開放平台業務均呈現同比下降態勢。智慧汽車、智慧醫療與智慧金融業務雖然呈現同比成長態勢,例如智慧金融年增19.33%,但在整體營收規模中的佔比實在少得可憐,智慧金融僅佔1.25%,智慧汽車與智慧醫療分別佔2.47%和2.48%。

如此看來,科大訊飛的主營業務表現不佳,創新業務又遠未達到大規模營收的階段。科大訊飛目前需要充分利用大型模型所帶來的巨大價值,以提升各項業務的商業競爭力。

但如今處於風口浪尖的大模型,能否幫助科大訊飛達成目標,還需要時間去驗證。

03 大模型狂潮祛魅時分

今年幾個月以來,全球的科技企業們處於一種近乎瘋狂當中。大型模型技術在國內外廣受關注和應用,尤其是國內的科技巨頭們推出了一系列自己的大型模型產品。

據「商業秀」不完全統計,目前已推出大模型產品的公司有百度文心一言、阿里通義千問、華為盤古、商湯日日新、崑崙萬維天工以及科大訊飛星火,同時王慧文、王小川等網路大佬創立的大模型公司也迅速獲得了融資。

但這麼多大模型都能順利跑出來嗎?大模型的核心競爭價值到底是什麼?大模型還能帶來哪些顛覆性機會?

瘋狂的大模型浪潮,也該到了理性審視的祛魅階段。

「現在湧現出許多大模型產品,但圍繞大模型的訓練和調試成本投入非常高,一般公司真燒不起,同時對中小企業來說自研經濟性較低,未來競爭更大可能發生在巨頭之間。」某風投機構投資經理董浩對「商業秀」表示。

英偉達的研究表示,GPT3最大規模的模型需要使用到175 Billions的參數量,需要使用512顆V100顯示卡訓練7個月時間,或使用1024顆A100晶片訓練長達一個月的時間。每月大模型訓練成本在數百萬美元以上量級。

上月,由中國人工智慧學會主辦的人工智慧大模型技術高峰論壇上,華為雲端人工智慧領域首席科學家田奇發表的演講中也提到,大模型開發和訓練的單次費用高達1200萬美元。

大模型開發成本如此高昂,但應用成本(收費)很低。 OpenAI在今年3月開放API(應用程式介面),讓第三方開發者透過API將ChatGPT整合至應用程式和服務。它的介面服務定價為每1000個令牌0.002美元,相對於GPT 3.5模型的價格便宜了約90%。

經濟方面的考量顯示,這項投入龐大的研發成本很難收回,更遑論就獲利了。因此,中小企業無法承擔這項生意,只有大企業才有足夠的資金和資源來投資並爭奪未來的市場份額。

或許正因如此,目前已發布大模型產品的企業,都將大模型能力內建到了自身已有的成熟產品中。這種方法可以提升現有產品的人工智慧能力和吸引更多客戶購買特定產品,而不僅僅是收取介面服務費。 」一位業內人士告訴《商業秀》。

但即便如此,國內大模型的競爭也極為激烈。作為大模型應用較成熟的辦公領域,就有多家企業推出了相關產品,如百度「文心一言」具備製作PPT的能力;釘釘接入阿里「通義千問」後可喚起10多項AI能力;位元組跳動旗下辦公應用飛書也將上線AI助理「MY AI」;金山辦公也推出「WPS AI」應用程式等。

這次,科大訊飛在星火大模型發布會上也發布了錄音筆、翻譯筆、辦公本等辦公產品,意在搶佔更多辦公場景的用戶。但是否真的能掘金成功,還要看接下來用戶的實際回饋狀況。

「雖然大模型競爭主要在巨頭之間,但巨頭也難以做到一家獨大,這其中的關鍵就在於數據。玩家在不同領域累積的數據不同,因此可能會在特定領域建立自己的核心優勢和獨特場景。」董浩進一步表示。

舉例來說,阿里有天貓、淘寶的電商數據,菜鳥系的物流數據,這是其他企業無法獲取的獨有數據,同樣科大訊飛在教育領域深耕多年,也積累了自己的獨有數據。這些數據,或許才是真正拉開企業差距的關鍵。

也就是說,那些沒有持續資金支持的中小公司,或許很難做出真正的通用大模型產品,而各個大廠推出的通用大模型產品,已經在急於考慮商業變現,缺乏研發耐心與技術突破。

董浩直言,「這一切都來得太快了,還沒幾個月,各家大模型似乎都成熟可商用了,但事實上這其中必然存在諸多泡沫。」

眼下這場狂熱的大模型競賽才剛開始,在巨頭和企業瘋狂入局與廝殺的同時,不少業內人士也疾呼:是時候該回歸初心,對技術保持敬畏,對商業保持探索,而不是一味追求速度、規模與效率,才能迎來大模型最好的時代。

(文中對話者皆為化名)

以上是科大訊飛回應'套殼”,AI大模型狂潮祛魅的詳細內容。更多資訊請關注PHP中文網其他相關文章!

相關標籤:
來源:sohu.com
本網站聲明
本文內容由網友自願投稿,版權歸原作者所有。本站不承擔相應的法律責任。如發現涉嫌抄襲或侵權的內容,請聯絡admin@php.cn
熱門教學
更多>
最新下載
更多>
網站特效
網站源碼
網站素材
前端模板