微软AR/VR专利提出利用角、线特征进行多摄像头图像对齐
MR系统可以使用多个摄像头,但在呈现图像时需要对齐图像。然而,图像对齐是一个具有挑战性的问题。因此,在名为“利用角点和线特征进行图像对齐的方法”的专利申请中,微软提出了一种解决方案
当然,行业早已存在利用角特征来进行图像对齐的方法。然而,在图像中识别角并根据识别的角对齐图像是一个耗时且计算密集型的操作。
微软提出的是一种更有效的改进技术,可以实现更好的特征匹配。发明主要介绍了使用角特征和线特征来执行视觉对齐的混合方法,而这种解决方案导致对齐过程中所需的约束更少,从而改进计算效率和特征匹配。
图11示出一个示例环境1100,其中用户正在使用头显摄像头1105和外部摄像头1110。如前所述,需要对齐从这两个摄像头生成的图像内容。但环境1100可能是一个弱光环境,或者可能是一个在热梯度或对比度方面具有低对比度的环境。
例如,在深夜物体冷却后,环境的温度梯度可能通常是均匀的。在这种情况下,环境的温度曲线或梯度可能低于特定的等温阈值1115。在这种情况下,用于对齐内容的传统技术可能会失效。微软描述的实施例为这类场景提供了解决方案。
图12示出可用于对齐图像的示例角检测1200过程。图12示出了由图11的头显摄像头1105生成的第一图像1205,以及由外部摄像头1110生成的第二图像1210。
进行角检测操作以识别图像中存在的“角”。举例来说,可以通过实施例来识别第一张图像中的角特征。换句话说,可以在图像中识别一组像素,确定这些像素集合对应于一个角
“角”是指具有非均匀强度的一个或多个像素,其具有相对于所述一个或多个像素水平定位的第一附近像素块和相对于所述一个或多个像素垂直定位的第二附近像素块。换句话说,角定义为一组一个或多个与相对于像素集在X和Y方向相邻角形成对比的像素。
识别第一图像1205中的角特征1215,并且也识别第二图像1210中的角特征。因此,成功识别出角特征1225。需要注意的是,角特征1225与角特征1215是相对应的
为了对齐图像内容,该实施例的任务是识别1230个角的阈值。角的阈值数量必须相互对应。换句话说,必须识别在第一张图像1205中识别的多个角,并且必须与在第二张图像1210中识别的多个角相对应
如果满足这些阈值,则实施例可以执行图像对齐操作以生成叠加图像1235,所述图像1235是其中对齐来自第二图像1210的内容,然后与来自第一图像1205的相应内容覆盖的图像。
进行角点检测和对齐是一项计算密集型操作,如果检测到的角点与图像之间的匹配不够好,整个过程可能会失败。例如,仅使用角点的方法,需要从一张图像中识别出至少5个角点,然后与第二张图像中的相应角点进行匹配。在低对比度条件下,即使识别出5个相应的角点也可能是一项挑战
在识别足够数量的角之后,实施例然后使用运动模型识别3D旋转,以便通过执行各种旋转和转换以使5个角彼此对齐来将图像内容从第一或第二图像适配到另一图像。执行这样的对齐是计算密集型。
因此,我们需要减少只使用角方法时所存在的约束,而图13则描述了这样一种技术。
在图13中展示了角点和线点检测1300的过程,这个过程包括了图12中的角点检测1200操作和线点检测操作的组合。需要注意的是,角点检测操作和线检测操作是同时进行的
通常情况下,识别图像中的相应的“线”比识别角点更简单,因此线检测过程通常比角点检测过程更快。由于这两个过程可以并行运行,并且线检测过程更快,因此添加线检测过程不会对整体对齐过程的速度产生负面影响
通过合并使用线条来对齐图像,可以在对齐过程中使用更少的角,从而导致放松的约束和通常更容易对齐。特别是在低温条件下,要求使用更少的角是非常有益的,因为很难找到和匹配角
“线”被定义为一组一个或多个像素,它们具有相对于一组或多个像素集的水平定位的第一附近像素块的均匀强度,并且具有相对于一组或多个像素集的垂直定位的第二附近像素块的不均匀强度。或者,它们具有相对于一组或多个像素集的水平定位的第一附近像素块的不均匀强度,并且具有相对于一组或多个像素集的垂直定位的第二附近像素块的均匀强度
在图13中,展示了代表图12中图像的第一图像1305和第二图像1310。图13还展示了一种实施方法,可以检测第一图像1305中的角特征1315
在对第一图像1305进行角特征的例检测时,同时也会进行线特征的检测,就像线特征1320和线特征1325所示的那样。一般来说,相较于可以检测到的角的数量,我们能够检测到更多的线
对第二图像1310执行角和线操作。为了说明,所述实施例识别角特征1330。与角检测操作并行,实施例同时检测第二图像1310中的线,如线特征1335和线特征1340。
请注意,角特征1330与角特征1315相对应;线特征1335与线特征1320相对应。线特征1340与线特征1325相对应。实施例可以识别这些对应关系,然后生成或使用适合于将这些特征点彼此对齐的运动模型
根据发明原理,我们定义了第一个阈值为1345。第一个阈值是指必须在两个图像中识别的相应角特征的数量,以便对它们进行对齐。同时,我们还定义了第二个阈值为1350。第二个阈值是指必须在两个图像中识别的相应行特征的数量,以使它们对齐
第一阈值1345和第二阈值1350的满足使实施例能够对齐来自第一图像1305和第二图像1310的内容以生成叠加图像1355。值得注意的是,阈值通常是指必须识别的角和线的总数。
在了解执行线特征检测的便利性和速度之后,你可能会质疑为什么实施例不仅依赖于线检测操作而避免执行角检测操作。原因是因为在图像中检测线条会导致孔径问题。
以下是重写后的内容: 根据图14,我们可以看到孔径问题,即孔径模糊度为1400。在图14中,线段1405是整条线的一部分。孔径模糊度1400指的是一条线的多个不同部分可能(但不正确地)与已识别的线段1405相关
例如,尽管线段1410实际上位于错误的位置或位置,但线段1410可能是与线段1405匹配的像素块。类似地,线段1415或线段1420可能包含可能映射或匹配线段1405中的像素的像素块。这样的场景在对齐过程中引入了模糊性。
因此,依靠线检测过程本身是不够的技术。换句话说,依靠线和角的组合可以使实施例使用宽松的约束,从而提高计算效率。
示例过程流1500在图15中展示。最初,会获取一组图像,如头戴式摄像头图像1505和外部摄像头图像1510。这些图像可能是热图像。图像中的温度梯度或对比度1520可能低于特定的对比度阈值1525。因此,在图像中识别足够数量的角可能相当困难。在这种情况下,可以利用混合方法检测角和线的组合以实现对齐
将头戴式摄像头图像1505和外部摄像头图像1510传送到角度检测器1530和线条检测器1535中,这两个检测器同时运行,彼此之间没有依赖关系
请注意,线检测器1535在检测线条时通常比角检测器1530在检测角度时更快。换句话说,线检测器1535的延迟时间较角检测器1530的延迟时间要短
角点检测器1530分析所述两个图像并识别所述图像中的角点1545。类似地,线检测器1535分析这两个图像并识别图像中的线1550。然后,实施例通过在两个图像内识别相应的角和线来执行对齐1555。
为了执行对齐,需要确定线和角的阈值数量。匹配阈值比识别角的数量或线的阈值更相关。然后,实施例将所识别的角和线拟合到诸如运动模型的3D模型1560中。然后对模型1560进行模型拟合1565操作,以旋转、平移和/或变换一幅图像,从而匹配或对齐另一幅图像中的相应角和线。
换句话说,当执行重投影操作时,实施例使用已识别的角和线来对齐来自一个图像的内容与来自另一个图像的内容
相关专利:Microsoft Patent | Image alignment using corner and line features
名为“Image alignment using corner and line features”的微软专利申请最初在2022年2月提交,并在日前由美国专利商标局公布。
以上是微软AR/VR专利提出利用角、线特征进行多摄像头图像对齐的详细内容。更多信息请关注PHP中文网其他相关文章!

热AI工具

Undresser.AI Undress
人工智能驱动的应用程序,用于创建逼真的裸体照片

AI Clothes Remover
用于从照片中去除衣服的在线人工智能工具。

Undress AI Tool
免费脱衣服图片

Clothoff.io
AI脱衣机

Video Face Swap
使用我们完全免费的人工智能换脸工具轻松在任何视频中换脸!

热门文章

热工具

记事本++7.3.1
好用且免费的代码编辑器

SublimeText3汉化版
中文版,非常好用

禅工作室 13.0.1
功能强大的PHP集成开发环境

Dreamweaver CS6
视觉化网页开发工具

SublimeText3 Mac版
神级代码编辑软件(SublimeText3)

必应(Bing)是微软公司推出的一款网络搜索引擎,搜索功能非常强大,分了国内版和国际版两个入口。这两个版本入口在哪呢?要怎么访问国际版呢?下面就来看看详细内容。 必应中国版网址入口:https://cn.bing.com/ 必应国际版网址入口:https://global.bing.com/ 必应国际版怎么访问? 1、首先输入打开必应的网址入口:https://www.bing.com/ 2、可以看到有国内版跟国际版的选项,我们只需要选择国际版,输入关键词即可。

4月18日消息,近日,一些使用Canary频道的MicrosoftEdge浏览器的用户反映,在升级到最新版本后,他们发现自动保存密码的选项被禁用了。经过调查,这是浏览器升级后的一个微调,而非功能被取消。在使用Edge浏览器访问网站前,用户反馈说浏览器会弹出一个窗口询问是否希望保存该网站的登录密码。选择保存后,在下一次登录时,Edge就会自动填充已保存的账号和密码,为用户提供了极大的便利。但最近的更新类似于微调,修改了默认设置。用户需要在选择保存密码后,再手动在设置中开启自动填充已保存的账号和密码

本站8月14日消息,在今天的8月补丁星期二活动日中,微软发布了适用于Windows11系统的累积更新,包括面向22H2和23H2的KB5041585更新,面向21H2的KB5041592更新。上述设备安装8月累积更新之后,本站附上版本号变化如下:21H2设备安装后版本号升至Build22000.314722H2设备安装后版本号升至Build22621.403723H2设备安装后版本号升至Build22631.4037面向Windows1121H2的KB5041585更新主要内容如下:改进:提高了

本站4月27日消息,微软本月初向Canary和Dev频道发布了Windows11Build26100预览版更新,预估会成为Windows1124H2更新的候选RTM版本。新版本中最主要的变化在于文件资源管理器、整合Copilot、编辑PNG文件元数据、创建TAR和7z压缩文件等等。@PhantomOfEarth发现,微软已经将24H2版本(Germanium)部分功能下放到23H2/22H2(Nickel)版本中,例如创建TAR和7z压缩文件。如示意图所示,Windows11将支持原生创建TAR

6月3日消息,微软正在积极向所有Windows10用户发送全屏通知,鼓励他们升级到Windows11操作系统。这一举措涉及了那些硬件配置并不支持新系统的设备。自2015年起,Windows10已经占据了近70%的市场份额,稳坐Windows操作系统的霸主地位。然而,市场占有率远超过82%的市场份额,占有率远超过2021年面世的Windows11。尽管Windows11已经推出已近三年,但其市场渗透率仍显缓慢。微软已宣布,将于2025年10月14日后终止对Windows10的技术支持,以便更专注于

3月21日消息,微软近日对其MicrosoftEdge浏览器进行了更新,新增了一项实用的“放大图像”功能。现在,用户在使用Edge浏览器时,只需右键点击图片,便可在弹出的菜单中轻松找到这一新功能。更为便捷的是,用户还可以将光标悬停在图片上方,然后双击Ctrl键,即可快速呼出放大图像的功能。根据小编的了解,最新发布的MicrosoftEdge浏览器已经在Canary频道进行了新功能测试。该浏览器的稳定版中也已经正式推出了实用的“放大图像”功能,为用户提供了更便捷的图片浏览体验。外国科技媒体也对这一

本站3月11日消息,消息人士结城安穗-YuuKi_AnS近日在X平台分享了一块微软Z1000固态硬盘样品的系列图片。从标签信息了解到,这块Z1000为EngineeringSample(工程样品),960GB容量,生产于2020年5月18日,DC3.3V供电,标称功耗15W。根据消息源透露,其支持NVMe1.2协议。▲微软Z1000固态硬盘正面(有标签面)照▲微软Z1000固态硬盘正面照(无标签)▲微软Z1000固态硬盘反面照▲微软Z1000固态硬盘反面照-主控特写参考结城安穗-YuuKi_An

在4月27日的消息中,微软公司宣布即将发布新版OutlookforWindows客户端的测试。此次更新主要聚焦于优化日历功能,旨在提升用户的工作效率,进一步简化日常工作流程。新版OutlookforWindows客户端的改进点在于其更加强大的日历管理功能。现在,用户能够更便捷地分享个人的工作时间与地点信息,使得会议规划变得更为高效。此外,Outlook还新增了人性化设置,允许用户设定会议自动提前结束或推迟开始,为用户提供了更多的灵活性,无论是换会议室、稍作休息还是享受一杯咖啡,都能轻松安排。根据
