AI大模型产品集体奔赴高考考场,教育赛道的讯飞星火能赢吗?
近日,2023年高考落下帷幕,“用AI写高考作文”的话题也备受热议。2023年,受ChatGPT热潮的影响,国内的AI大模型产品也如雨后春笋。例如,百度、阿里、360等互联网巨头企业均相继推出文心一言、通义千问、360智脑等AI大模型产品。
与此同时,一些深耕教育AI赛道的玩家也不甘人后,借助AI大模型,将其原本的优势得以释放。作为智能语音和人工智能赛道的上市企业,科大讯飞推出的大模型产品讯飞星火,也在这波AI热潮中备受关注。
那么,与高考与教育赛道高度相关的讯飞星火,实际写作水平与使用体验如何?笔者对其进行了高考作文相关的系列提问。通过亲测体验,发现这确实是一款十分智能的AI大模型产品。虽然也有一些美中不足的地方,但是也可谓瑕不掩瑜。
瑕不掩瑜,真实水平或不敌优等生
首先,笔者以全国甲卷为例,与科大讯飞星火认知大模型进行了对话。该卷作文题目是:人们因技术发展得以更好地掌控时间,但也有人因此成了时间的仆人。这句话引发了你怎样的联想与思考?请写一篇文章。
笔者将该高考作文的要求,全文输入讯飞星火。讯飞星火的“高考作文”如下:全文一共855字,回答时间在30秒以内。
图源:讯飞星火认知大模型
通过输出的内容可以看出,科大讯飞星火对于提问的语义理解基本正确,行文的逻辑也十分顺畅,例如,在如何正确的利用时间方面,讯飞星火采用了“因为......所以”等表达方式,可谓有理有据,同时行文的措辞表达也非常的口语化,并没有多么华丽的辞藻与晦涩难懂的句子。
不过,作为体现考生写作水平最重要的考试,高考作文还会考查考生作文的立意新颖程度、文字功底等。而如果从这些角度去评价讯飞星火的“高考作文”,也不难看出其存在的明显不足。
首先,在立意方面。讯飞星火用“时间”是把杀猪刀为题,虽然通俗易懂,但是未免过于普通,甚至让人觉得有些敷衍套作的意味。
其次,文章中有多个论点,例如“时间很重要”、“我们应该学会利用时间”、“应该劳逸结合等”。只是,这些观点的论据,都带有一定的说教意味,既没有引经据典,也没有太多实例辅助读者理解,因此论据也显得不够具体和有说服力、更缺少文采。
虽然文末举了两个例子,但是没有插入到文章对应的观点之中进行佐证,也显得不够完整。为了验证讯飞星火的智能性,笔者继续对其进行提问,试图让其再写一篇立意更新颖、更有深度的文章。全文如下,一共827字,回答时间同样在30秒以内。
通过全文内容可以看出,这次的“高考作文”在内容方面,更加接近笔者的需求。例如,行文中用到了莎士比亚、爱因斯坦、爱迪生、乔布斯等名人名言。
只不过,除了前两位名人关于时间的名言能够对其观点进行佐证外,文章中引用的爱迪生与乔布斯的名言却与观点关系并不大,因此依然显得说服力不足。由此可见,虽然讯飞星火理解了作文题目要求的语义,但是在引经据典的作文要求方面,还是有“套作”的嫌疑。
据笔者亲测多款大模型产品,发现这类产品“套作”的现象十分普遍。因此有网友分析表示,或许AI大模型产品并不理解“套作”的含义。按照一些网友的理解,套作指的是不能生搬硬套、套公式套模板。因此,也有网友评价讯飞星火自动生成的文章过于普通,更像是一个普通初中生的作文。
除此以外,笔者发现,大多数大模型产品的“高考作文”,体裁都是议论文。因此,也试图让讯飞星火换一种体裁与风格,试试讯飞星火写作更加生活化的话题作文的水平。于是,又以2023年新课标I卷关于“故事”的话题作文,来对讯飞星火进行测试。
将作文题目全文输入讯飞星火,输出的文章字数是763字,文章的中心思想是:故事有力量,而好故事的意义与价值是多方面的。全文也非常有层次的进行了逐个论点的陈述、佐证。而佐证的内容,主要是引经据典,通过古代、近现代的文学作品进行举例说明,从而得出结论。
不过,全文体裁看起来,依然是一篇议论文。笔者认为,现代元素还是少了一些,依然具有很强的说教味道。如果能够结合好故事给身边亲友带来的改变来举例说明,或许远比只是提到那些文学作品,更有说服力。
体验过关,但美中有不足
好在讯飞星火在功能体验上,比市面其他大模型产品,更加体贴入微。例如,除了查看历史提问、新建对话等,而且相关菜单也放在了十分显眼的位置,避免用户无法快速找到历史对话记录,还可以一键选择“重新回答”。
于是,笔者试着换一种提问方式,并试着连续发问。不过亲测发现,科大讯飞星火似乎不太支持连续发问。
对于笔者针对上一篇作文的疑问,讯飞星火也采用了“忽略”的处理方式。没有正面回答笔者关于对上一篇“高考作文”不满意的回答,而是直接重新写了一篇文章。
值得惊喜的是,这次输出的关于“好故事”的作文,终于不再是议论文了。而是很具生活化,列举了很多实际生活案例的一篇文章,因此读起来也更加像真实考生的创作。
由此可见,AI大模型产品输出的内容如何,关键还在于用户如何提问。在讯飞星火能够全面理解用户提问的语义基础上,只要提问的内容足够具体、要求合理,讯飞星火是能够输出用户真正想要的内容的。
不过,美中不足的是,讯飞星火在理解用户的提问意图时,还是存在一些明显的偏差。例如前文的多次测试中,明确要求作文需要自拟题目,字数不少于800字。但是讯飞星火实际输出的作文,既没有标题,字数有时也不及800字。通过亲测对比其他大模型产品,这种问题也相对普遍。
由此也可以预见,未来大模型产品如何更加精准的进行语义理解,将是非常重要的竞争力之一。
人类未来需要什么样的AI大模型产品?
测完讯飞星火大模型产品的智能程度、用户体验,我们不妨从用户角度来看,人类到底需要什么样的大模型产品。首先,我们来看看讯飞星火是怎么回答这个问题的,也非常有意思。
通过讯飞星火的回答,不难看出,这些因素确实是用户未来十分关注的优化方向。只是,在这些特点之前,如何建立机器人与人类之间的良好沟通,才是第一步。
这正如不同国家的人,使用不同的语言,如果没有翻译机,彼此又不懂他国语言,那么就是鸡同鸭讲,自然得不到正确的反馈。因此笔者认为,所有的大模型产品,未来首要需要解决的,便是如何正确地理解人类的基础语言,包括随着时代变化而产生的新词汇、网络语言、口语、方言等。
难能可贵的是,科大讯飞一直深耕智能语音和人工智能赛道,其翻译机产品在全球畅销,便是其对不同语言转换技术的有力印证。因此,对比之下,讯飞星火相比其他大模型,理论上具有更强的技术研发能力,能让讯飞星火目前存在的一些瑕疵进行优化迭代。
而在各个互联网科技大厂都纷纷推出大模型产品之时, 今年高考的“作文大赛”,既是一个练兵场,也是一块试金石。在各个大厂集体奔赴考场时,谁负谁胜已经不再重要,重要的是借助这次契机,大厂的AI大模型存在什么利弊,或许各大玩家心知肚明。
非常有趣的是,当笔者试图提问讯飞科技,AI大模型产品哪家强之时,其回答非常的“圆滑”,也非常的低调,并没有宣称自己就是行业第一,甚至在回答内容里,提到的都是别家的产品,都没有提到“讯飞星火”。如果用调侃的语气来看这样的回答,科大讯飞这种“低调务实”的精神,还是值得肯定的。
人类的进步,永远都是思想的突破。人工智能的应用,目前还只是万里长征的第一步。虽然离人们想要的完美尚有距离,但是一定会向着人类想要达到的效果迈进。
结语
作为教育AI赛道的玩家之一,科大讯飞显然是更懂教育、更懂学生的。因此,相比一些大模型产品面向的行业大而全,讯飞星火在AI大模型集体写作文这个热门事件上,几乎是独一无二的存在,因此讯飞星火在受到更多关注的同时,也将背负着更多人的希望。
我们相信,在AI大模型的应用越来越成熟的同时,其逐渐向行业垂直,走向专业化、生态化也将成为必然,而科大讯飞不仅能将讯飞星火用在其学习机等AI硬件产品上,更将因为其开放性,而为教育行业添砖加瓦、增色添彩。
以上是AI大模型产品集体奔赴高考考场,教育赛道的讯飞星火能赢吗?的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

ChatGPT大火带动AI又一波热潮,不过业界普遍认为,当AI步入大模型时代,只有大企业和超级富有的企业才玩得起AI,因为AI大模型的打造非常昂贵。首先是计算昂贵。多伦多大学市场营销教授AviGoldfarb说:“如果你想创办一家企业,自己开发大语言模型,自己计算,成本太高了。OpenAI是很贵的,要数以十亿计的美元。”租赁计算当然会便宜不少,但企业仍然要向AWS等企业支付昂贵费用。其次是数据昂贵。训练模型需要海量数据,有时数据是现成的,有时不是。CommonCrawl和LAION等数据可以免费

近年来,随着新技术模式的出现,各行业应用场景价值打磨与海量数据积累下的产品效果提升,人工智能应用已从消费、互联网等领域,向制造、能源、电力等传统行业辐射。各行业企业在设计、采购、生产、管理、销售等经济生产活动主要环节的人工智能技术和应用成熟度在不断提升,加速人工智能在各环节的落地覆盖,逐渐将其与主营业务相结合,以实现产业地位提高或经营效益优化,进一步扩大自身优势。人工智能技术创新应用的大规模落地,推动了大数据智能市场的蓬勃发展,同样也为底层的数据治理服务注入了市场活力。伴随着大数据、云计算以及算

AI大模型是指使用大规模数据和强大的计算能力训练出来的人工智能模型。这些模型通常具有高度的准确性和泛化能力,可以应用于各种领域,如自然语言处理、图像识别、语音识别等。AI大模型的训练需要大量的数据和计算资源,通常需要使用分布式计算框架来加速训练过程。这些模型的训练过程非常复杂,需要对数据的分布、特征的选择、模型的结构等方面进行深入的研究和优化。AI大模型的应用范围非常广泛,可以用于各种场景,如智能客服、智能家居、自动驾驶等。在这些应用中,AI大模型可以帮助人们更快速、更准确地完成各种任务,提高工

生成式AI(AIGC)开启了人工智能通用化的新纪元,围绕大模型的百舸争流蔚为壮观,算力基础设施是首要的竞逐焦点,而存力觉醒也日益成为业界共识。在新的时代,大模型从单模态走向多模态,参数和训练数据集的规模呈几何级数增长,海量的非结构化数据需要高性能混合负载能力的支撑;与此同时,数据密集型范式大行其道,超算、高性能计算(HPC)等应用场景迈向纵深,既有的数据存储基座已难以满足不断升级的需求。如果说算力、算法、数据是驱动人工智能发展的“三驾马车”,那么在外部环境发生巨大变化的背景下,三者亟需重新达成动

vivo于11月1日在2023年的开发者大会上发布了自主研发的通用人工智能大模型矩阵——蓝心大模型vivo宣布,蓝心大模型将推出5款不同参数量级的模型,分别包含十亿、百亿、千亿三个级别的参数,覆盖核心场景,模型能力在行业中处于领先地位。vivo认为,一个好的自研大模型需要满足以下5点要求:规模大,功能全面,算法强劲,安全可靠,自主进化,并且要广泛开源重写后的内容如下:其中,首先是蓝心大模型7B,这是一个70亿级别的模型,旨在为手机端和云端提供双重服务。vivo表示,该模型在语言理解、文本创作等场

最近,一支计算机科学家团队研发了一种更灵活、更具弹性的机器学习模型,它们具有周期性遗忘已知信息的能力,这是现有大型语言模型所不具备的特点。实测表明,在很多情况下,“忘却法”的训练效率很高,忘却型模型表现也会更好。韩国基础科学研究院(InstituteforBasicScience)的AI工程师JeaKwon说,新研究意味着AI领域取得明显进步。“忘却法”训练效率很高目前主流的AI语言引擎大多采用人工神经网络技术。这种网络结构中的每个“神经元”实际上是一个数学函数,它们之间相互连接,接收和传递信息

最近一段时间,人工智能再次成为人类创新的焦点,围绕AI的军备竞争比以往任何时候都更加激烈。不仅科技巨头纷纷扎堆加入大模型之战,生怕错过了新风口,就连包括北京、上海、深圳等地也纷纷出台政策举措,致力于开展大模型创新算法及关键技术研究,打造人工智能创新高地。AI大模型蓬勃发展,各大科技巨头纷纷加入近日,在2023中关村论坛上发布的《中国人工智能大模型地图研究报告》显示,中国人工智能大模型正呈现蓬勃发展态势,出现了多个在行业有影响力的大模型。百度创始人、董事长兼CEO李彦宏更是直言,我们正处在全新起点

1978年,来自加州大学的StuartMarson等人,成立了世界上第一家CADD商业公司,开创性地研发出了一套化学反应及数据库的检索系统。自此开始,计算机辅助药物设计(CADD)进入快速发展的时代,成为药企进行药物研发的重要手段之一,为这一领域带来了革命性的升级。1981年10月5日,《财富》杂志发表了题为《下一次工业革命:默克公司通过计算机设计药物》的封面文章,正式宣告了CADD技术的问世。1996年,第一款基于SBDD(基于结构的药物设计)研发的药物碳酸酐酶抑制剂成功上市,CADD在药物研
