国防科大、旷视提出首个在ARM上实时运行的通用
今天跟大家分享一篇前天新出的论文《ThunderNet: Towards Real-time Generic Object Detection》,来自国防科大与旷视的研究团队(孙剑老师在列)提出了较早的能够在移动端ARM芯片实时运行的两阶段通用目标检测ThunderNet(寓意像Thunder雷一样快^_^),并称该算法后续将开源!
以下是作者信息:
论文地址:
https://arxiv.org/pdf/1903.11752v1.pdf
一作为来自国防科大的Zheng Qin和旷视的Zeming Li。
提出问题
目标检测的算法有很多,但要在移动平台,比如手机上的ARM CPU实时还比较难,主流的state-of-the-art目标检测算法无法实时,而一些号称可以跑起来的算法距离state-of-the-art的精度差距太大。
作者希望设计速度快而精度高的算法,满足移动端的部署需求。
下图是该文提出的ThunderNet算法的三个版本与目前轻量级检测网络在COCO test-dev数据集上的精度和计算量的比较图,可见ThunderNet在精度达到或超过之前轻量级检测网络的同时,降低了计算量。
以上均为在CPU上单线程运行结果,MobileNet-SSD运行在骁龙820,MobileNet/MobileNetV2-SSDLite运行在骁龙810,Pelee运行在Intel i7-6700K (4.0 GHz),ThunderNet运行在骁龙845。
算法思想
作者是在经典的两阶段目标检测算法的基础上做的改进。
网络结构如下:
作者分两个方向做了5点改进:
一、改进速度。
1. 使用轻量级、面向目标检测任务设计的骨干网Snet。
网络参数如下:
2. 压缩RPN网络部分,降低候选目标区域生成的时间。
3. R-CNN子网络使用1024维的全连接层,提高速度。
二、改进特征表示的鉴别性。
1. 设计了上下文增强模块CEM结构,它可以有效结合三个尺度的特征图,编码更多的上下文信息,增大感受野,生成更具鉴别性的特征。
2. 设计了空间注意力模块SAM结构,它可以利用RPN中学习到的信息,从上下文增强模块提精特征图的特征分布。
实验结果
作者在VOC 2007 test数据集上的实验结果如下,与现有其他算法相比,在保持高精度同时,计算量也处于较低水平。
下图是在COCO test-dev数据集上与其他算法的比较,同样达到了计算量小精度高的目标。
以下是一些检测结果示例:
在运行速度方面,该算法能到达到与MobileNet-SSD相当的精度,此时在ARM上运行24.1fps,x86上运行47.3fps。使用SNet146骨干网的ThunderNet精度超过YOLOv2,而计算量仅为其1/37。
期待作者早日放出代码!
声明:本文版权归原作者所有,文章收集于网络,为传播信息而发,如有侵权,请联系小编及时处理,谢谢!
时间:2019-04-01 19:19 来源: 转发量:次
声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
相关文章:
- [机器学习]更深、更轻量级的Transformer!Facebook提出:DeLigh
- [机器学习]深度学习中的3个秘密:集成、知识蒸馏和蒸馏
- [机器学习]深度学习三大谜团:集成、知识蒸馏和自蒸馏
- [机器学习]世界最大、最复杂的GPU!这颗集成1000亿个晶体管
- [机器学习]人工智能十年回顾:CNN、AlphaGo、GAN……它们曾这
- [机器学习]更深、更轻量级的Transformer!Facebook提出:DeLigh
- [机器学习]龙泉寺贤超法师:用 AI 为古籍经书识别、断句、
- [机器学习]机器学习基础图表:概念、原理、历史、趋势和算法
- [机器学习]深度学习中的3个秘密:集成、知识蒸馏和蒸馏
- [机器学习]深度学习三大谜团:集成、知识蒸馏和自蒸馏
相关推荐:
网友评论:
最新文章
热门文章