5月30日,国际人工智能顶会CVPR2024举办的第3届野外像素级视频理解挑战赛(The 3rd Pixel-level Video Understanding in the Wild, PVUW。下文简称PVUW)公布赛事结果,美图影像研究院(MTLab)再获殊荣,斩获视频语义分割(VSS)、复杂场景视频目标分割(MOSE)双赛道亚军,视频全景分割挑战赛(VPS)赛道季军,这也是美图影像研究院(MTLab)第3次在CVPR大会上摘得奖项,共获得了1金3银3铜的杰出成绩。
作为全球范围内计算机视觉领域的顶尖盛会,CVPR凭借其深远影响力吸引了众多顶尖学府、科研机构的踊跃参与,成为全球AI领域前沿科研成果展示的舞台,备受学术界和产业界的瞩目。同时,顶级 PVUW 赛事专注于视频理解领域,由牛津大学、复旦大学、浙江大学、北京航天航空大学、北京交通大学、Amazon、Meta 等 业内 及产业界的 权威 研究者共同发起,凭借其前沿性及挑战性,本届竞赛吸引了包括中国科学院大学、中国科学院自动化研究所、哈尔滨工业大学、美图公司、三星、中兴通讯等海内外 知名 高校、科研院所及 领先 企业参加。本届 PVUW 竞赛共包含 4 个赛道,除视频语义分割挑战赛(VSSChallenge)、视频全景分割挑战赛(VPSChallenge)外,新增复杂场景视频目标分割挑战赛(MOSEChallenge)和基于动作描述的指向性视频分割挑战赛(MeViSChallenge) 2 个超高难度赛道,其中,复杂场景视频目标分割挑战赛(MOSEChallenge)采集了目前最大规模的复杂场景视频目标分割数据集 ComplexVideoObjectSegmentation (MOSE),包括目标的消失和重现、不显眼的小物体、严重的遮挡以及拥挤的环境等。旨在于帮助应对视频理解领域目前面临的如背景复杂性、目标遮挡和消失重现、描述动作的文本理解等挑战,提升对复杂场景及现实场景的理解能力。美图影像研究院(MTLab)此次参赛取得的骄人成绩背后,是在视频领域长期布局与持续探索的成果佐证,同时也已将这一尖端技术应用于美图公司旗下美图秀秀、美颜相机、Wink、美图设计室等产品中,为用户带来“视频人像精修”、“AI商品视频”、“智能抠图”等实用功能与创意玩法,通过创新研发成果为广大用户提供优质影像与设计服务。随着新兴视频形态的蓬勃发展,视频行业进一步向多元化发展,美图影像研究院(MTLab)也持续加大在视频领域的研发投入,目前专业视频人像精修工具Wink荣膺视频编辑工具赛道第二名,开拍已成为口播创作工具赛道领军者。作为美图的核心研发中枢,美图影像研究院(MTLab)未来也将继续专注于AI领域前沿技术研发,推动AI技术的落地应用,通过技术创新与升级为用户和客户打造更优的AI工作流。以上是美图影像研究院(MT Lab)斩获3项国际人工智能顶会大奖的详细内容。更多信息请关注PHP中文网其他相关文章!