学校网站 ENGLISH

人才强校|李振波团队在图像实例分割研究工作取得新进展

信电学院 2021年08月02日 报道 浏览次数:

本网讯  信电学院 近日,信电气学院李振波教授课题组论文《SOTR: Segmenting Objects with Transformers》被计算机视觉领域顶级会议ICCV(国际计算机视觉大会)录用,论文在图像实例分割研究工作取得新进展,提出了一种基于Transformer的高质量图像实例分割模型SOTR。

论文提出的模型建立在卷积神经网络(CNN)主干之上,并附加了两个并行的子任务:Transformer用于预测实例类别和卷积核;多级上采样模块用于动态生成分割掩码。为提高Transformer的性能,论文提出了一种新的Attention模块,沿列和行分别捕获垂直和水平方向的远程上下文信息,将时间复杂度从O(H2W2)降低为O(H*W2+W*H2)。此外,SOTR易于与各种CNN主干和Transformer变体结合,在图像分割精度和模型训练收敛性方面有相当大的提高。大量实验证明,SOTR在微软COCO数据集上表现超过了当前最先进的图像实例分割方法。该研究成果将有助于定位图像中的每个物体并进行像素级标注,可用于动植物表型信息准确获取、图像目标检测、遥感图像解释描述、自动驾驶场景理解、医学图像病理研判等方面,提升计算机视觉技术在不同领域应用的效果。该研究工作由我校和美国加州大学伯克利分校合作完成,我校李振波教授为论文通讯作者,信电学院2019级硕士研究生郭若皓为第一作者,美国加州大学伯克利分校硕士生牛丹彤、我校信电学院大数据181班瞿李傲分别为第二和第三作者。该研究得到了国家重点研发计划和广东省重点领域研发计划项目的资助。

ICCV由IEEE(电气与电子工程师协会)主办,与CVPR(计算机视觉与模式识别会议)和ECCV(欧洲计算机视觉会议)并称计算机视觉方向的三大顶级会议,在业内具有极高的评价。不同于在美国每年召开一次的CVPR和只在欧洲召开的ECCV,ICCV在全世界范围内每两年召开一次。同时,ICCV是中国计算机学会(CCF)推荐的人工智能领域的A类顶级会议(CCF-A)。

 

责任编辑:何志勇 刘铮
分享到:
标签: