科大讯飞回应“套壳”,AI大模型狂潮祛魅
文|数智商业秀 崔思
编辑|张弘一
“星火大模型与OpenAI,是什么关系?”
“我和OpenAI没有关系,我是讯飞星火认知大模型,我是由科大讯飞优秀的人工智能科学家、工程师和语言学家等组成的团队自主研发的。”
很快,「商业秀」就回答了星火认知大模型输入的问题。这与近期讯飞星火大模型的一则传言不符。
近日有网友发现,讯飞星火大模型在有些“问答”中会出现“我是由OpenAI开发的”等内容,由此一则关于“讯飞星火大模型被质疑‘套壳OpenAI的ChatGPT’”的消息传播开来。
5月11日,科大讯飞在最新披露的投资者关系活动记录表中表示,星火大模型“套壳OpenAI的ChatGPT”既不符合事实,也不符合逻辑。
科大讯飞具体表示,如果是套壳 ChatGPT,就不可能出现讯飞星火大模型的响应速度比ChatGPT还快;更不会出现讯飞星火大模型在文本生成、知识问答、数学能力等方面的结果均优于 ChatGPT 的情况。
我们有理由相信,此时的科大讯飞,比任何一家公司都需要大模型的故事,而非“套壳”事故。且先不论大模型本身的优劣,光看科大讯飞迅速辟谣这一行径,足见星火大模型对其之重要。在拯救股价方面,大型模型的影响是无与伦比的,在本季度甚至更长的时间内都如此。
今年4月底,科大讯飞发布了2022年财报和2023年一季度报,财报显示,净利润出现大幅下滑态势,市场似乎对其瞬间丧失了大部分信心,股价一路下跌。直到5月6月(星期六),科大讯飞发布星火大模型,在5月8日开盘后,其股价才开始拉升10%,此后数日,一度呈现上涨趋势。市场对这家公司,似乎又恢复了信心。
推出大模型,再经历被质疑“套壳OpenAI”事件,科大讯飞也必须面对共同的AI话题:大模型纷纷扎堆,是时候该理性祛魅了。
在这个大模型横空出世的时代,科大讯飞并非“孤勇者”。自ChatGPT发布以来,掀起的科技军备竞赛就一直没有停息,其余威在国内也愈演愈烈,各家公司在AI领域“卷”个不停,前段时间大模型集中爆发,被评价为“颇有十年前互联网‘百团大战’甚至‘千团大战’的气势”。
据不完全统计,在ChatGPT发布后的短短4个月时间里,至少已经有30多个国内研发机构和企业,在ChatGPT发布之后纷纷推出了自己品牌的大模型和相关产品。
在不少企业声称自己是“国内首发”的情况下,类ChatGPT的技术在整个科技圈内变得十分普遍,资本市场也开始出现波动。与大模型相关的媒体报道铺天盖地,随后又陷入一阵短暂的沉寂。而下一波,大概率还在来的路上。
大模型带来的机遇不言而喻,但在这场疯狂的竞赛中,谁又能真正走到最后?决战未来,各家真正的核心竞争力又是什么?
以商业发展的历史规律来看,市场会在喧嚣过后崩溃泡沫,大规模模型的狂潮也不可能永远持续。要真正抓住由AI技术带来的产业变革机遇,必须去理解大型模型所带来的核心性改变,并进行冷静思考。
01 超越了ChatGPT?
目前,星火认知大模型在国内处于遥遥领先地位,中文表现已经超出了ChatGPT,而英文表现也接近领先地位。”在科大讯飞星火认知大模型发布会上,刘庆峰自信满满地说道。
作为继百度、阿里、商汤、昆仑万维后,第五家正式发布大模型的公司,科大讯飞一上场,就迫不及待展示自己的强大能力。
刘庆峰更是全程主持发布会,并与科大讯飞研究院院长刘聪现场展示了包括文本生成、语言理解、知识问答、逻辑推理、数学能力、编程能力等多项能力。
在现场演示环节,刘聪提问:“你为什么叫星火 ”“如果有个小伙子跟女朋友吵架了,那他应该宁死不屈还是能屈能伸?” “孔子在2008年北京奥运会上说了什么?”等各类稀奇古怪的问题,星火迅速“接招”,并给出了恰如其分的回答。
在数学能力方面,刘聪也抛出了“花坛里有三种花,一共88朵,其中月季花的数量是菊花的4倍,牡丹花的数量是菊花的5倍少2朵,那么请问花坛里一共有多少朵牡丹花?”这类计算问题。星火也很快给出了答案,并罗列了相关解题步骤。
刘庆峰随即表示,数理能力一定程度代表了一个大模型的聪明程度。讯飞星火大模型不仅在国内系统中遥遥领先,而且已经超越了ChatGPT。
对此,「商业秀」也进行了多轮“挖坑式”测试,例如询问“姚明在几几年获得了亚洲足球先生的称号?” “范志毅在NBA服役多少年?斩获了多少个进球?”等问题。星火都准确识别出了人为“陷阱”,并给出了恰当的回答。
这表明,在常识性问题上,星火都进行了一定的训练,并具备一定的纠错能力。
相同的问题,「商业秀」也通过ChatGPT-3进行了测试,其同样也给出了恰当的回答,但在信息丰富度上不及星火全面。
在数理能力上,「商业秀」也测试了“鸡兔同笼,鸡兔一共有25只,笼子里脚一共有74只,请问分别有多少只鸡和多少只兔子?”“一支股票今天涨10%,明天跌10%,请问赚还是赔?”等问题,星火也迅速给出了正确回答。
「商业秀」将同样的数理问题抛给了ChatGPT-3,在这方面,结果显示ChatGPT-3的回答更有逻辑性。后者先给出了结论,再给出了具体实例,并且还会有延伸的问题,配合原问题答疑解惑。
星火还支持语音提问和输出,即可通过语音提问,模型输出的答案也能转换为语音,并能通过持续对话调整语音风格。
「商业秀」通过语音询问“鸡兔同笼,笼里一共有35只,一共有94只脚,问一共有多少只鸡和多少只兔子” “中国拿到网球大满贯职业选手是谁”等问题。星火也准确识别了语音内容,并给出了相应的答案。
但这个操作,要求提问者的语速要很慢,并且能一字一句以标准普通话说出,否则星火可能无法准确识别出相应文字,或文字识别不准确导致回答有误。
经过多轮测试,「商业秀」认为,星火具备了一定的大语言模型能力,并且能够在某些特定领域输出自己的商业价值。
在发布会上,科大讯飞还发布了一系列结合星火大模型的产品,例如讯飞智能办公本能将语音实时转写与墨水屏纸感书写相结合,对会议记录内容形成一份精简的会议纪要;“星火大模型+智能座舱”为数千个车型提供多轮、多人、多区域、多模态的语音交互;基于大模型的生成式RPA(机器人流程自动化),让数字员工更智能……
但星火也不是没有缺点,刘庆峰自己也在发布会上坦言,“大模型技术目前还存在不少待攻克的缺陷。这些问题包括更新新知识不及时、混淆事实问答、编造历史和传统文化中的情节等。”他随之提及,上述问题在今年会有明显的改进。
据了解,星火认知大模型始于2022年12月。彼时,科大讯飞启动了“1+N”大模型技术攻关。其中,“1”是通用认知智能大模型算法研发及高效训练方案底座平台,“N”是将认知智能大模型技术应用在教育、医疗、人机交互、办公、翻译等多个行业领域。
不到半年时间,星火认知大模型正式面世,研发时间之短暂、模型发布之匆忙,这直接导致包括科大讯飞在内的很多企业被外界质疑。
在如此短的时间内,星火的推出仅仅标志着一个新的起点,它还需经历多轮迭代和优化。刘庆峰在发布会上公布了星火认知大模型的发展规划:今年6月9日,星火大模型将突破开放式问答,多轮对话能力和数学能力再升级;8月15日,星火认知大模型将突破代码能力,多模态交互再升级;10月24日,星火认知大模型通用模型将直接对标ChatGPT,其中中文能力超越后者,英文能力与后者相当。
从这份规划日期来看,科大讯飞甚至细化到了哪一天,这从侧面或许表明其急于想将大模型能力落地应用,从而推进商业化。业内认为,这或许与近几年科大讯飞的商业化能力不佳有关。
02 急需大模型“提振信心”
此前,科大讯飞优异的业绩与赚钱能力常被业内称赞,但在经历了连续10年的增长后,神话基本结束于2022年。
科大讯飞2022年财报显示,该公司实现营收188.2亿元,同比微增2.77%;毛利为76.84亿元,同比微增2%;归母净利润5.61亿元,同比下滑63.94%;扣非净利润4.18亿元,同比下滑57.31%。
这句话可以重写为:科大讯飞已经计入政府补贴的数据显示,到2022年,其政府补贴预计将达到11亿元。在同一时间,这也是科大讯飞近五年来净利润同比增长率首次出现下降。数据显示,从2018年到2022年,科大讯飞的净利润增长率分别为24.71%、51.12%、66.48%、14.13%和﹣63.94%。
资本市场对这一成绩单颇感失望,在财报发布后,科大讯飞股价下跌超9%。
对于业绩出现如此大幅变动,科大讯飞方面给出了三个原因。
首先是大环境的影响,科大讯飞表示“受到去年12月份和今年1月份特殊的社会经济客观环境,以及春节假期影响,导致部分项目无法顺利及时推进”。
其次,继2019年被列入美国实体清单,2022年10月7日被再次极限施压,由于调整供应链和相关合同签署等工作影响了当季订单节奏。
最后一点,与星火大模型有关。科大讯飞提到,去年12月启动的“1+N认知智能大模型专项攻关”影响了当期利润,这从侧面印证科大讯飞在大模型上的投入很大。
来到今年,这三大原因仍持续影响科大讯飞的业绩。
数据显示,2023年一季度,科大讯飞实现营收28.88亿元,同比下降17.64%;净亏损5789.5万元,上年同期净利润1.1亿元;扣非后归母净亏损3.38亿元,上年同期净利润1.46亿元。
据界面新闻报道,科大讯飞总裁吴晓如透露,2022年和2023年一季度讯飞净利润下滑严重主要在于公司在教育、医疗等持续运营型业务的合作平台拓展投入、新产品研发以及核心技术自主可控和国产化适配等方向新增投入约8亿元。
不过,科大讯飞对业绩下滑的情况似乎不太担心。在业绩会上表示目前基于在国产替代和业务开拓上的进展,预计从今年二季度开始将实现收入和毛利正向增长,并有信心实现全年高质量增长的目标。
科大讯飞的核心业务包括教育产品与服务、信息工程和开放平台。其中教育产品是其主要营收来源,占到总营收比例的32.74%。
科大讯飞还构建了面向G端、B端和C端三类客户的业务体系:G端主要是面向地市县等区域,涵盖区域内各类学校和用户的因材施教解决方案;B端主要是面向学校的大数据精准教学、英语听说课堂、智慧作业等;C端主要以面向家长的AI学习机、个性化学习手册、课后服务课程服务等产品。
财报显示,G端业务目前已累计在 50 多个市、区(县)级应用;B端业务中的讯飞课后服务业务已覆盖超300区县、12000余所学校;C端的AI学习机该年销售额增长超50%,但并未透露出具体销售数量与金额。
而实际上,其业绩与目标业绩尚相差甚远。据2022年初的公告,科大讯飞预计其各个地区的业务将保持50%的增长。同时提到,2022年个性化学习手册业务预计营收增长超70%,AI学习机收入目标增长200%+,目标十四五做到年收入100 亿元。
除了主营业务未达预期外,科大讯飞的智慧城市、开放平台及消费者业务、智慧汽车、智慧医疗等业务表现也较为一般。
财报显示,智慧城市下属的信息工程、数字政府行业应用、智慧政法行业应用三大板块与开放平台业务均呈现同比下降态势。智慧汽车、智慧医疗与智慧金融业务虽然呈同比增长态势,例如智慧金融同比增长19.33%,但在整体营收规模中的占比实在少得可怜,智慧金融仅占比1.25%,智慧汽车与智慧医疗分别占比2.47%和2.48%。
如此看来,科大讯飞的主营业务表现不佳,创新业务又还远未达到大规模营收的阶段。科大讯飞当前需要充分利用大型模型所带来的巨大价值,从而提升各项业务的商业竞争力。
但如今处于风口浪尖的大模型,能否帮助科大讯飞实现目标,还需要时间去验证。
03 大模型狂潮祛魅时分
今年数月以来,全球的科技企业们处于一种近乎疯狂当中。大型模型技术在国内外得到广泛关注和应用,尤其是国内的科技巨头们推出了一系列自己的大型模型产品。
据「商业秀」不完全统计,目前已推出大模型产品的公司有百度文心一言、阿里通义千问、华为盘古、商汤日日新、昆仑万维天工以及科大讯飞星火,同时王慧文、王小川等互联网大佬创立的大模型公司也迅速获得了融资。
但这么多大模型都能顺利跑出来吗?大模型的核心竞争价值到底是什么?大模型还能带来哪些颠覆性机会?
疯狂的大模型浪潮,也该到了理性审视的祛魅阶段。
“现在涌现出很多大模型产品,但围绕大模型的训练和调试成本投入非常高,一般公司真烧不起,同时对中小企业来说自研经济性较低,未来竞争更大可能发生在巨头之间。”某风投机构投资经理董浩对「商业秀」表示。
英伟达的研究表示,GPT3最大规模的模型需要使用到175 Billions的参数量,需要使用512颗V100显卡训练7个月时间,或者使用1024颗A100芯片训练长达一个月的时间。每月大模型训练成本在数百万美元以上量级。
上月,由中国人工智能学会主办的人工智能大模型技术高峰论坛上,华为云人工智能领域首席科学家田奇发表的演讲中也提到,大模型开发和训练的单次费用高达1200万美元。
大模型开发成本如此高昂,但应用成本(收费)很低。OpenAI在今年3月开放API(应用程序接口),允许第三方开发者通过API将ChatGPT集成至应用程序和服务中。它的接口服务定价为每1000个令牌0.002美元,相对于GPT 3.5模型的价格便宜了约90%。
经济方面的考量显示,这项投入巨大的研发成本很难收回,更遑论实现盈利了。因此,中小企业无法承担这项生意,只有大企业才有足够的资金和资源来投资并争夺未来的市场份额。
或许正因如此,目前已发布大模型产品的企业,都将大模型能力内置到了自身已有的成熟产品中。这种方法可以提升现有产品的人工智能能力和吸引更多客户购买具体产品,而不仅仅是收取接口服务费。”一位业内人士告诉「商业秀」。
但即便如此,国内大模型的竞争也极为激烈。作为大模型应用较为成熟的办公领域,就有多家企业推出了相关产品,如百度“文心一言”具备制作PPT的能力;钉钉接入阿里“通义千问”后可唤起10多项AI能力;字节跳动旗下办公应用飞书也将上线AI助手“MY AI”;金山办公也推出“WPS AI”应用等。
这一次,科大讯飞在星火大模型发布会上也发布了录音笔、翻译笔、办公本等办公产品,意在抢占更多办公场景的用户。但是否真的能掘金成功,还要看接下来用户的实际反馈情况。
“虽然大模型竞争主要在巨头之间,但巨头也难以做到一家独大,这其中的关键就在于数据。玩家在不同领域积累的数据不同,因此可能会在特定领域建立自己的核心优势和独特场景。”董浩进一步表示。
举例来说,阿里有天猫、淘宝的电商数据,菜鸟系的物流数据,这是其他企业无法获取的独有数据,同样科大讯飞在教育领域深耕多年,也积累了自己的独有数据。这些数据,或许就是真正拉开企业差距的关键。
也就是说,那些没有持续资金支持的中小公司,或许很难做出真正的通用大模型产品,而各个大厂推出的通用大模型产品,已经在急于考虑商业变现,缺乏研发耐心与技术突破。
董浩直言,“这一切都来得太快了,还没几个月,各家大模型似乎都成熟可商用了,但事实上这其中必然存在诸多泡沫。”
眼下这场狂热的大模型竞赛才刚刚开始,在巨头和企业疯狂入局与厮杀的同时,不少业内人士也疾呼:是时候该回归初心,对技术保持敬畏,对商业保持探索,而不是一味追求速度、规模与效率,才能迎来大模型最好的时代。
(文中对话者均为化名)
以上是科大讯飞回应“套壳”,AI大模型狂潮祛魅的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

ChatGPT大火带动AI又一波热潮,不过业界普遍认为,当AI步入大模型时代,只有大企业和超级富有的企业才玩得起AI,因为AI大模型的打造非常昂贵。首先是计算昂贵。多伦多大学市场营销教授AviGoldfarb说:“如果你想创办一家企业,自己开发大语言模型,自己计算,成本太高了。OpenAI是很贵的,要数以十亿计的美元。”租赁计算当然会便宜不少,但企业仍然要向AWS等企业支付昂贵费用。其次是数据昂贵。训练模型需要海量数据,有时数据是现成的,有时不是。CommonCrawl和LAION等数据可以免费

近年来,随着新技术模式的出现,各行业应用场景价值打磨与海量数据积累下的产品效果提升,人工智能应用已从消费、互联网等领域,向制造、能源、电力等传统行业辐射。各行业企业在设计、采购、生产、管理、销售等经济生产活动主要环节的人工智能技术和应用成熟度在不断提升,加速人工智能在各环节的落地覆盖,逐渐将其与主营业务相结合,以实现产业地位提高或经营效益优化,进一步扩大自身优势。人工智能技术创新应用的大规模落地,推动了大数据智能市场的蓬勃发展,同样也为底层的数据治理服务注入了市场活力。伴随着大数据、云计算以及算

AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力,可以应用于各种领域,如自然语言处理、图像识别、语音识别等。AI大模型的训练需要大量的数据和计算资源,通常需要使用分布式计算框架来加速训练过程。这些模型的训练过程非常复杂,需要对数据的分布、特征的选择、模型的结构等方面进行深入的研究和优化。AI大模型的应用范围非常广泛,可以用于各种场景,如智能客服、智能家居、自动驾驶等。在这些应用中,AI大模型可以帮助人们更快速、更准确地完成各种任务,提高工

生成式AI(AIGC)开启了人工智能通用化的新纪元,围绕大模型的百舸争流蔚为壮观,算力基础设施是首要的竞逐焦点,而存力觉醒也日益成为业界共识。在新的时代,大模型从单模态走向多模态,参数和训练数据集的规模呈几何级数增长,海量的非结构化数据需要高性能混合负载能力的支撑;与此同时,数据密集型范式大行其道,超算、高性能计算(HPC)等应用场景迈向纵深,既有的数据存储基座已难以满足不断升级的需求。如果说算力、算法、数据是驱动人工智能发展的“三驾马车”,那么在外部环境发生巨大变化的背景下,三者亟需重新达成动

vivo于11月1日在2023年的开发者大会上发布了自主研发的通用人工智能大模型矩阵——蓝心大模型vivo宣布,蓝心大模型将推出5款不同参数量级的模型,分别包含十亿、百亿、千亿三个级别的参数,覆盖核心场景,模型能力在行业中处于领先地位。vivo认为,一个好的自研大模型需要满足以下5点要求:规模大,功能全面,算法强劲,安全可靠,自主进化,并且要广泛开源重写后的内容如下:其中,首先是蓝心大模型7B,这是一个70亿级别的模型,旨在为手机端和云端提供双重服务。vivo表示,该模型在语言理解、文本创作等场

最近,一支计算机科学家团队研发了一种更灵活、更具弹性的机器学习模型,它们具有周期性遗忘已知信息的能力,这是现有大型语言模型所不具备的特点。实测表明,在很多情况下,“忘却法”的训练效率很高,忘却型模型表现也会更好。韩国基础科学研究院(InstituteforBasicScience)的AI工程师JeaKwon说,新研究意味着AI领域取得明显进步。“忘却法”训练效率很高目前主流的AI语言引擎大多采用人工神经网络技术。这种网络结构中的每个“神经元”实际上是一个数学函数,它们之间相互连接,接收和传递信息

最近一段时间,人工智能再次成为人类创新的焦点,围绕AI的军备竞争比以往任何时候都更加激烈。不仅科技巨头纷纷扎堆加入大模型之战,生怕错过了新风口,就连包括北京、上海、深圳等地也纷纷出台政策举措,致力于开展大模型创新算法及关键技术研究,打造人工智能创新高地。AI大模型蓬勃发展,各大科技巨头纷纷加入近日,在2023中关村论坛上发布的《中国人工智能大模型地图研究报告》显示,中国人工智能大模型正呈现蓬勃发展态势,出现了多个在行业有影响力的大模型。百度创始人、董事长兼CEO李彦宏更是直言,我们正处在全新起点

1978年,来自加州大学的StuartMarson等人,成立了世界上第一家CADD商业公司,开创性地研发出了一套化学反应及数据库的检索系统。自此开始,计算机辅助药物设计(CADD)进入快速发展的时代,成为药企进行药物研发的重要手段之一,为这一领域带来了革命性的升级。1981年10月5日,《财富》杂志发表了题为《下一次工业革命:默克公司通过计算机设计药物》的封面文章,正式宣告了CADD技术的问世。1996年,第一款基于SBDD(基于结构的药物设计)研发的药物碳酸酐酶抑制剂成功上市,CADD在药物研
