商汤 37 篇论文入选 ECCV 2018，开源 mm-detection 检测

商汤科技SenseTime

+199

AI影响因子

开发

企业：商汤科技SenseTime

操作：开源

内容：mm-detection 检测库

论文

名称：ECCV

时间：

企业：商汤科技SenseTime

更多相关

雷锋网 AI 科技评论消息，9 月 8 日-14 日，2018 欧洲计算机视觉大会（ECCV 2018）在德国慕尼黑召开，ECCV 每两年举办一次，与 CVPR、ICCV 共称为计算机视觉领域三大顶级学术会议，每年录用论文约 300 篇。根据 ECCV 2018 宣布的最终结果，商汤科技及联合实验室共有 37 篇论文入选，主要集中在以下领域：大规模人脸与人体识别、物体检测与跟踪、自动驾驶场景理解与分析、视频分析、3D 视觉、底层视觉算法、视觉与自然语言的综合理解等。此外，商汤科技在 2018 年 COCO 比赛物体检测（Detection）项目中夺得冠军，开源 mm-detection 检测库。凭借以上事项，商汤科技在雷锋网(公众号：雷锋网)旗下学术频道 AI 科技评论数据库产品「AI 影响因子」中有相应加分。

在商汤入选 ECCV 2018 论文《人脸识别的瓶颈在于数据集噪声（The Devil of Face Recognition is in the Noise）》中，对于现有人脸数据集中的标签噪声问题进行了深入研究，对 MegaFace 和 MS-Celeb-1M 数据集中的噪声特性和来源做了全面的分析，发现干净子集对于提高人脸识别精度效果显著。

商汤 37 篇论文入选 ECCV 2018，开源 mm-detection 检测库

在入选论文《量化模仿-训练面向物体检测的极小 CNN 模型（Quantization Mimic: Towards Very Tiny CNN for Object Detection）》中，提出了一种简单而通用的框架—量化模仿，来训练面向物体检测任务的极小 CNN 模型。作者提出联合模仿与量化的方法来减小物体检测 CNN 模型的参数量实现加速。在有限计算量的限制下，该框架在 Pascal VOC 和 WIDER Face 数据集的物体检测性能均超越了当前物体检测的先进水平。

商汤 37 篇论文入选 ECCV 2018，开源 mm-detection 检测库

在 2018 年的 COCO 比赛中，商汤科技研究员和香港中文大学-商汤联合实验室同学组成的团队在物体检测（Detection）项目中夺得冠军。在此次竞赛中，商汤团队开发了如下三项全新技术，获得了大幅度的性能提升：

（1）新的多任务混合级联架构（hybrid cascade）。通过把不同子任务进行逐级混合，这种新架构有效地改善了整个检测过程中的信息流动。

（2）通过特征导引产生稀疏锚点，而不是使用传统的规则分布的密集锚点。这种特征导引的方案使得锚点的投放更为精准，平均召回率提升了超过10个百分点。

（3）采用一种新型的FishNet网络结构，它有效地保留和修正多个尺度的信息，能更有效地用于图像级，区域级，以及像素级预测任务。

在 test-dev 上，商汤团队对上述框架进行了全面测试，其中单模型和多模型（最终提交的结果来自于五个模型混合的框架）的 mask AP 分别达到了 47.4% 和 49.0%，比去年冠军（也是商汤团队获得）的结果（44.0% 和 46.3%）有约 3 个百分点的明显提高。在传统的基于检测框的指标 bbox AP 上，这个新的框架也分别达到了单模型 54.1% 和多模型的 56.0% 的性能，比去年冠军的结果（50.5% 和 52.6%）也有较大的提升。

此外，在 ECCV 期间，香港中文大学-商汤联合实验室还开源了检测库 mm-detection（https://github.com/open-mmlab/mmdetection），这个开源库提供了已公开发表的多种视觉检测核心模块，通过这些模块的组合，可以迅速搭建出各种著名的检测框架，比如 Faster RCNN，Mask RCNN 和 R-FCN 等，以及各种新型框架，从而大大加快检测技术研究的效率。