华中科技大学硕士生黄钊金作为第一作者完成研究成果Mask Scoring R-CNN,在COCO图像实例分割任务上超越了何恺明(首获CVPR“最佳论文奖”的中国学者)的Mask R-CNN,拿下了计算机视觉顶会CVPR 2019的口头报告。该成果从5000多篇投稿中脱颖而出,成为最顶尖的5.6%。
黄钊金师从华中科技大学电信学院副教授王兴刚,王兴刚也是这篇论文的作者之一。目前,相关算法已经开源。
什么是Mask R-CNN?它其实是一种简洁、灵活的实例分割框架。2017年,计算机研究者何恺明凭借Mask R-CNN的研究成果拿下ICCV 2017最佳论文奖。
与何恺明的研究成果相比,黄钊金的Mask Scoring R-CNN在性能上有什么优越性呢?在论文中,研究人员提出了一种给算法的“实例分割假设”打分的新方法。这个分数打得是否准确,会影响实例分割模型的性能。
这些模型在实例分割任务里,虽然输出结果是一个蒙版,但打分却是和边界框目标检测共享的,都是针对目标区域分类置信度算出来的分数。这个分数和图像分割蒙版的质量未必一致,用来评价蒙版的质量,可能就会出偏差。
于是,这篇CVPR 2019论文就提出了一种新的打分方法——给蒙版打分,被称之为蒙版得分(Mask Score)。
Mask Scoring R-CNN中提出的计分方式很简单:不仅仅直接依靠检测得到的分类算分,而且还让模型单独学一个针对蒙版的得分规则:MaskIoU head。
MaskIoU head是在经典评估指标AP(平均正确率)启发下得到的,会拿预测蒙版与物体特征进行对比。MaskIoU head同时接收蒙版head的输出与ROI的特征(Region of Interest)作为输入,用一种简单的回归损失进行训练。
最后,同时考虑分类得分与蒙版的质量得分,就可以评估算法质量了。评测方法公平公正,实例分割模型性能自然也上去了。
实验证明,在挑战COCO benchmark时,在用MS R-CNN的蒙版得分评估时,在不同基干网路上,AP始终提升近1.5%。
在COCO 2017测试集(Test-Dev set)显示的成绩对比中,无论基干网络是纯粹的ResNet-101,还是用了DCN、FPN、MS R-CNN的AP成绩都比Mask R-CNN高出一点几个百分点。在COCO 2017验证集上,MS R-CNN的得分也优于Mask R-CNN。
歡迎光臨 比思論壇 (http://108.170.10.234/) | Powered by Discuz! X2.5 |