尽管是通过AI绘制的,我的画还是获得了奖项
这是一副刚刚获得获得了美国科罗拉多州博览会举办的艺术比赛一等奖的作品《太空歌剧院》。而该画的创作者杰森艾伦自曝该作品是其用AI绘画 App“Midjourney”创作产生的。
《太空歌剧院》的出现,让人们再次将目光放在AI与艺术的融合上。伴随着技术和软件能力的提升,“人人都可以画画”的时代已经到来了。百度文心一格相关负责人表示,计算机与艺术创作的融合,具有很大的想象空间,AI将对艺术创新起到正向促进作用。
每个普通人都可以通过文字来描述自己的想法,然后通过机器来实现创作,人工智能在艺术领域的学习与创作能力正以蓬勃之势不断刷新我们的认知,一个新的艺术类别也逐渐兴起。
艺术因为AI消亡?
“我们正在目睹艺术在眼前消亡。”这是诸多网友在得知《太空歌剧院》的创作过程后最直观的看法。他们认为Allen使用AI生成图像完全是在作弊,但Allen自己却不以为然。
他介绍了这幅作品的创作过程耗时一个月,不停地修改输入关键词,给MidJourney提交尽可能精确具体的词语,创作了100多张作品后,挑选出了三张自己认为最满意的,用GipaPixel AI将图片清晰化,又用Photoshop进行多次调整,最后才打印在画布上。
这并不是AI作品第一次在正式的艺术舞台上亮相,2018年10月,艺术品拍卖行佳士得曾以约一万美元的价格成交了一幅由AI生成的油画《Edmond Belamy的肖像》。创作者让AI模型分析了15000幅14至20世纪的油画后,仿出了一幅风格类似的作品。
佳士得对作品的形容是:在艺术与人工智能之间交互的实验。意味着,这幅拍卖作品的核心价值并不在画作本身,人们关注更多的是当时看来前所未有的生产方式。这足以说明,AI技术生成的图片不是既有图片的拼凑,而是类似人类经过长期绘画训练后的“再创作”。
尽管人工智能作品充满了冲击力和视觉张力,但和几乎所有其他的深度学习模型一样,在理解知识、推理、逻辑方面做得都不够好。一个已经被广泛注意到的问题,是人工智能经常会生成奇形怪状的手。
这就要先提到AI绘图的原理。据百度文心一格相关负责人介绍,AI从海量图文对应的数据中学习到了“语言描述”与“艺术画面”的关联,以随机化的起点开始,不断修正画作,最终形成在审美上与人类经验与知识高度一致的成品。
人的一只手有超过 20 个关节,是人类身体上形状最丰富的结构之一。在大部分用来训练的图片中,手部经常不是最核心的部位,不同角度、不同距离、手不同势、还有被阴影和其他物体遮挡等现象,就会让AI在手的表现上出现问题。
从技术角度来看,需要提高的主要是两个方面,包括生成的可控性和细节描述能力。目前AI对于数量、逻辑、关系、多图关联等问题暂无有效的解决方案。例如要求生成2个苹果,左边是红色,右边是绿色。虽然这边的关系并不负责,但是在通常情况下,模型并不能稳定的生成正确的结果。
另一方面,AI对于更加复杂的、有规律性细节的描述能力有待提升。例如一栋居民楼的窗户应该具有多种形态,开着的、关上的、有人在窗边看风景、有晾在阳台上的衣服等等……但目前的AI绘画尚未具备这样的能力,同理,手部绘画也是这样的问题。
“大力出奇迹”的大模型
人工智能上一次惊艳互联网还是2020年。
这一年,由OpenAI公司开发的GPT-3横空出世。有开发者给GPT-3 做了图灵测试,发现GPT-3对答如流,正常得不像个机器。而最近又一次惊艳互联网的ChatGPT同样出自这家公司。
相比GPT-3,ChatGPT的主要提升点在于记忆能力。ChatGPT可以储存对话信息,延续上下文,从而实现连续对话,这在对话场景中至关重要,极大地提升了对话交互模式下的用户体验。
ChatGPT的背后离不开大模型、大数据、大算力。根据国盛证券研报数据显示,ChatGPT技术底座使用的是微调后的GPT-3.5系列模型,有着多达1750亿个模型参数,OpenAI主要使用的公共爬虫数据集有着超过万亿单词的人类语言数据集。GPT-3.5在微软Azure AI超算基础设施上进行训练,总算力消耗约3640PF-days(即每秒一千万亿次计算,运行3640个整日)。
而为AI绘画提供优质应用体验的关键技术是大模型。2021年3月OpenAI发布人工智能绘画产品DALL·E,现已升级到DALL·E 2;谷歌、Meta、百度、阿里等互联网巨头也推出了支持生成内容的AI大模型以及对应产品。
百度基于文心大模型推出了AI艺术与辅助创作平台文心一格,是百度依托于飞桨、文心大模型持续的技术创新,在“AI作图”方面发布的产品和技术工具。定位为面向有设计需求和创意的人群,基于文心大模型智能生成多样化AI创意图片,辅助创意设计,打破创意瓶颈。
文心一格是基于文心大模型的文生图系统实现的产品化创新。在文心一格官网,用户只需输入自己的创想文字,并选择期望的画作风格,即可快速获取由一格生成的相应画作。文心一格既能生产恢弘绚丽的艺术画,也能生产创意脑洞的超写实图,兼具中国特色,支持国风、动漫、插画、油画等十余种绘画风格和不同画幅的选择。
百度文心大模型已摸索出一条大模型产业化路径。百度CTO王海峰指出,具有算法、算力和数据综合优势的企业,可以将模型生产的复杂过程封装起来,通过低门槛、高效率的生产平台,为千行百业提供大模型服务,从而形成一条大模型产业化路径。
突破绘画的边界
1839年,照相机问世,给彼时纯手工的绘画带来了巨大的冲击。法国知名艺术家德拉洛奇也曾发出悲叹:“绘画已死!”但随着相机普及,摄影作品作为一种艺术品的观念,也逐渐为大众所接受。
19世纪英国著名的“卢德运动”中,大量英国工人闯进工厂破坏纺织机等机器,因为他们认为机器抢走了他们的工作。
但最终,绘画没有死,艺术出现了新的表现形式,机器帮助社会创造了更多的生产力。经济学家凯恩斯曾分析,新技术的出现会导致技术性失业。为了避免被淘汰,人们总是不得不提升应用各类技术的能力。
从目前的实践来看,AI绘画带来了新的创作方式,大幅提高了绘画效率。无论是对画师、设计师、艺术家等专业视觉内容创作者还是媒体、作者等文字内容创作者来说,AI作画无疑是提供创意思路,辅助进行艺术创作,既提升效率也提升质量。
对于未来,技术和应用都还将快速发展。从技术上来看,未来AI不止可以作画,还可以基于文字内容一键生成AI原创短视频,并自动配上字幕、语音、音乐等等。例如,2022万象·百度移动生态大会上,由百度APP推出的数字人度晓晓作词作曲演唱的《启航星》,是首支全AIGC生成的MV,其中画面部分由文心一格根据歌词自动生成。应用上,AI作画将不断的融入到各种内容创作场景,除了常见的插画师和艺术设计领域,未来在移动内容生产、游戏、工业设计、AI教育等场景都会有越来越广泛的应用。
对于卓越的艺术家来说,他们不可能会被AI替代。但普通的艺术家为了更具竞争力,很可能需要学习利用AI进行艺术创作,就好像现在的画师都要掌握数字绘图软件一样,先进的工具最终会成为必要的生产资料。
就像《太空歌剧院》的创作者对于争议回应时说的那样:“我不会为此道歉,我没有违反任何规则,我赢了。”
以上是尽管是通过AI绘制的,我的画还是获得了奖项的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

AI Hentai Generator
免费生成ai无尽的。

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

热门话题

本站6月27日消息,剪映是由字节跳动旗下脸萌科技开发的一款视频剪辑软件,依托于抖音平台且基本面向该平台用户制作短视频内容,并兼容iOS、安卓、Windows、MacOS等操作系统。剪映官方宣布会员体系升级,推出全新SVIP,包含多种AI黑科技,例如智能翻译、智能划重点、智能包装、数字人合成等。价格方面,剪映SVIP月费79元,年费599元(本站注:折合每月49.9元),连续包月则为59元每月,连续包年为499元每年(折合每月41.6元)。此外,剪映官方还表示,为提升用户体验,向已订阅了原版VIP

通过将检索增强生成和语义记忆纳入AI编码助手,提升开发人员的生产力、效率和准确性。译自EnhancingAICodingAssistantswithContextUsingRAGandSEM-RAG,作者JanakiramMSV。虽然基本AI编程助手自然有帮助,但由于依赖对软件语言和编写软件最常见模式的总体理解,因此常常无法提供最相关和正确的代码建议。这些编码助手生成的代码适合解决他们负责解决的问题,但通常不符合各个团队的编码标准、惯例和风格。这通常会导致需要修改或完善其建议,以便将代码接受到应

想了解更多AIGC的内容,请访问:51CTOAI.x社区https://www.51cto.com/aigc/译者|晶颜审校|重楼不同于互联网上随处可见的传统问题库,这些问题需要跳出常规思维。大语言模型(LLM)在数据科学、生成式人工智能(GenAI)和人工智能领域越来越重要。这些复杂的算法提升了人类的技能,并在诸多行业中推动了效率和创新性的提升,成为企业保持竞争力的关键。LLM的应用范围非常广泛,它可以用于自然语言处理、文本生成、语音识别和推荐系统等领域。通过学习大量的数据,LLM能够生成文本

大型语言模型(LLM)是在巨大的文本数据库上训练的,在那里它们获得了大量的实际知识。这些知识嵌入到它们的参数中,然后可以在需要时使用。这些模型的知识在训练结束时被“具体化”。在预训练结束时,模型实际上停止学习。对模型进行对齐或进行指令调优,让模型学习如何充分利用这些知识,以及如何更自然地响应用户的问题。但是有时模型知识是不够的,尽管模型可以通过RAG访问外部内容,但通过微调使用模型适应新的领域被认为是有益的。这种微调是使用人工标注者或其他llm创建的输入进行的,模型会遇到额外的实际知识并将其整合

编辑|ScienceAI问答(QA)数据集在推动自然语言处理(NLP)研究发挥着至关重要的作用。高质量QA数据集不仅可以用于微调模型,也可以有效评估大语言模型(LLM)的能力,尤其是针对科学知识的理解和推理能力。尽管当前已有许多科学QA数据集,涵盖了医学、化学、生物等领域,但这些数据集仍存在一些不足。其一,数据形式较为单一,大多数为多项选择题(multiple-choicequestions),它们易于进行评估,但限制了模型的答案选择范围,无法充分测试模型的科学问题解答能力。相比之下,开放式问答

机器学习是人工智能的重要分支,它赋予计算机从数据中学习的能力,并能够在无需明确编程的情况下改进自身能力。机器学习在各个领域都有着广泛的应用,从图像识别和自然语言处理到推荐系统和欺诈检测,它正在改变我们的生活方式。机器学习领域存在着多种不同的方法和理论,其中最具影响力的五种方法被称为“机器学习五大派”。这五大派分别为符号派、联结派、进化派、贝叶斯派和类推学派。1.符号学派符号学(Symbolism),又称为符号主义,强调利用符号进行逻辑推理和表达知识。该学派认为学习是一种逆向演绎的过程,通过已有的

编辑|KX在药物研发领域,准确有效地预测蛋白质与配体的结合亲和力对于药物筛选和优化至关重要。然而,目前的研究没有考虑到分子表面信息在蛋白质-配体相互作用中的重要作用。基于此,来自厦门大学的研究人员提出了一种新颖的多模态特征提取(MFE)框架,该框架首次结合了蛋白质表面、3D结构和序列的信息,并使用交叉注意机制进行不同模态之间的特征对齐。实验结果表明,该方法在预测蛋白质-配体结合亲和力方面取得了最先进的性能。此外,消融研究证明了该框架内蛋白质表面信息和多模态特征对齐的有效性和必要性。相关研究以「S

本站7月5日消息,格芯(GlobalFoundries)于今年7月1日发布新闻稿,宣布收购泰戈尔科技(TagoreTechnology)的功率氮化镓(GaN)技术及知识产权组合,希望在汽车、物联网和人工智能数据中心应用领域探索更高的效率和更好的性能。随着生成式人工智能(GenerativeAI)等技术在数字世界的不断发展,氮化镓(GaN)已成为可持续高效电源管理(尤其是在数据中心)的关键解决方案。本站援引官方公告内容,在本次收购过程中,泰戈尔科技公司工程师团队将加入格芯,进一步开发氮化镓技术。G
