近日,信息学院陈东岳教授团队在深度图像补全领域中再次取得重要进展,其研究成果以“Efficient Indoor Depth Completion Network using Mask-adaptive Gated Convolution”为题,发表在人工智能领域顶级国际学术会议The 39thAnnual AAAI Conference on Artificial Intelligence(AAAI 2025)上。该研究由陈东岳教授(通讯作者)、黄霆暄硕士生(第一作者)、苗嘉成硕士生(第二作者)、贾同教授和青年教师邓诗卓共同完成。这是继团队在ICCV 2023提出的注意力引导门控卷积网络(AGG-Net)后,在深度图像补全领域的重要开拓性工作,进一步推进了深度图像补全技术的发展及其在机器人领域的应用。
深度图像补全是计算机视觉领域的前沿技术问题之一,广泛应用于机器人导航、虚拟现实、具身智能、工业视觉检测等领域,其主要解决由于深度传感器误差导致的深度信息缺失问题。本次工作在先前工作的基础上,进一步针对室内场景中深度补全的应用需求,提出了一种轻量化的深度补全框架,如图1所示。该框架的核心模块包括掩码自适应门控卷积,可对不同缺失区域进行细粒度特征提取,以及双向去归一化对齐映射,剔除无关信息的同时高效融合深度信息与色彩信息,大幅提升深度图像重建的精度与效率。在NYU-Depth V2、DIML和SUN RGB-D等主流数据集上的实验结果表明,该方法在精度和效率方面均显著优于现有方法;在保持高精度的同时,模型参数的轻量化为该深度图像补全技术在嵌入式系统中的实际应用铺平了道路。应用本方法得到的可视化效果图如图2所示。
图1室内场景深度图像轻量化补全模型结构图
图2应用团队所提出的深度图像补全模型的效果图
AAAI是中国计算机学会CCF推荐的A类国际学术会议,是全球人工智能领域最具影响力的学术会议之一,涵盖机器学习、自然语言处理、计算机视觉、多智能体系统等多个人工智能核心方向,旨在推动领域内技术突破与发展。据悉,本次会议共收到来自12957篇投稿,录用3032篇,录用率约23.4%,体现了其极高的学术影响力和严格的筛选标准。此次研究的成功发表标志着开云手机入口官网-开云(中国)和模式识别与智能系统学科在人工智能领域的又一次重要拓展,有效提升了我校在相关领域的学术影响力和贡献度。