像素变形金刚 (PiT) 挑战视觉模型中局部偏差的需求
Meta AI 和阿姆斯特丹大学的最新研究表明,变压器(一种流行的神经网络架构)可以直接对图像的各个像素进行操作,而不依赖于大多数现代计算机视觉模型中存在的局部归纳偏差。
Meta AI 和阿姆斯特丹大学的研究人员证明,Transformers(一种流行的神经网络架构)可以直接对图像的各个像素进行操作,而不依赖于局部归纳大多数现代计算机视觉模型中都存在偏见。
他们的研究题为“单个像素上的变形金刚”,挑战了长期以来的信念,即局部性(相邻像素比远处像素更相关的概念)是一个基本概念
传统上,诸如卷积神经网络(ConvNet)和视觉变换器(ViT)之类的计算机视觉架构通过卷积核、池化操作和补丁化等技术合并了局部性偏差,假设相邻像素是
相比之下,研究人员引入了像素变换器(PiT),它将每个像素视为一个单独的标记,消除了有关图像 2D 网格结构的任何假设。令人惊讶的是,PiT 在各种任务中都取得了高性能的结果。
例如,当使用 VQGAN 的潜在标记空间将 PiT 应用于图像生成任务时,它们在 Fréchet Inception Distance 等质量指标上优于局部偏向的同行( FID)和初始分数(IS)。
虽然 PiT 在 Perceiver IO Transformer 上运行,由于序列较长,计算成本可能会很高,但它们挑战了视觉模型中对局部性偏差的需求。随着处理大序列长度方面的进步,PiT 可能会变得更加实用。
该研究最终强调了减少神经架构中归纳偏差的潜在好处,这可能会导致针对不同视觉任务的更通用、更强大的系统和数据模式。
新闻来源:https://www.kdj.com/cryptocurrencies-news/articles/pixel-transformers-pits-challenge-locality-bias-vision-models.html
以上是像素变形金刚 (PiT) 挑战视觉模型中局部偏差的需求的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

在对投资者的毁灭性打击中,OM咒语加密货币在过去24小时内倒塌了约90%,价格下降到0.58美元。

您是否注意到了加密货币世界中模因硬币的迅速崛起?最初的在线笑话很快发展成为有利可图的投资机会

在今天早些时候的公告中,日本公司Metaplanet透露已收购了另外319个比特币(BTC),将其总公司持有量推高了4,500 BTC。

领先的数字资产经理Bitwise已宣布在伦敦证券交易所(LSE)上列出了其四个加密交易所交易产品(ETP)。

伪分析师Dave The Wave在社交媒体平台上告诉他的149,300个关注者X,比特币看起来正处于印刷逆向头和露肩模式的早期阶段

随着Binance Coin(BNB)的增长趋势