展望:2019年AI企业如何落地安防?
[摘要] 如果说2018年是AI企业的融资年的话,2019年对AI企业来说就是“AI赋能智慧”的落地之年。
如果说2018年是AI企业的融资年的话,2019年对AI企业来说就是“AI赋能智慧”的落地之年。2018年的寒冬不仅仅是对AI企业而言,各行各业都感同身受,房地产尤为明显,企业名称连“房地产”三个字都去掉了,纷纷改名“发展”,就是一个兆头。
寒冬之后,紧缩的就是投资,资本家也没有多少钱了。2019年如果AI企业不能再依靠讲故事、比赛拿No 1、做演讲拿融资的话,如何实现大规模扩展、招人、再发展?企业存在的意义必须有收入、有利润,那么2019年必须用Case来说话,用中文说就是业务必须落地,今天AI智道 就是要和大家谈这个话题。
AI赋能智慧落地有几大场景:
◦金融:几家独角兽企业都取得不错的成绩。
◦医疗:AI落地的重要场景。
◦自动驾驶:预计大规模落地还需要1-2年的时间。
◦机器人:类似于自动驾驶,尚需假以时日。
◦教育:音频和文字识别暂时是主要场景,视频技术刚刚启动。
◦消费:主要是2C的市场,手机端应用是大热门。
◦大安防市场:AI视觉企业必争之地。
作为大安防市场的自媒体,纽豪斯并不像和大家过多的探讨其它几个场景,主要是想和大家聊聊大安防市场。
AI赋能安防场景分析
车牌识别:烂大街的应用,是AI赋能大安防发展最成熟的市场,广泛应用于卡口、电子警察以及停车场出入口管理,是传统安防企业的海大天(HDT,海康、大华、天地伟业)、以萨等企业的天下,AI新贵几无可能2019在这个市场上分得大蛋糕。
车辆大数据:如果是基于卡口、电子警察的车辆大数据,自然是没有AI企业的份,主要还是HDT、以萨的市场,以及众多的大安防SI(佳都科技、东方网力、海信网络、高新兴、易华录)的市场。如果将车辆大数据引入更大的“城市交通大脑”,情况完全不一样,BAT、高德、滴滴均有布局并在2018年取得了不错的战国,尤其是阿里巴巴独落10个城市级大脑工程。四大AI独角兽(SKYY,商汤、旷视、依图、云从)如果能够积极布局,相信还有很多机会,毕竟大脑级工程的起步尚未超过2年。
:同样是烂大街的场景。凡号称安防AI的几乎没有那家没有人脸识别产品或系统的,据报道瑞为公司在嵌入式门禁人脸识别市场份额很高(有待进一步考证),但要说基于全国身份证系统的人脸大库做Face ID,算法上优秀的当算SKYY、云天励飞、海康,以广东飞识、Huawei VPaaS为例,采用的是多算法融合系统,同时可以支持以上算法。人脸识别在2018年饱受非议,主要涉及隐私、GDPR《通用数据保护条例》,甚至是微软公司也发布了《使用人脸识别技术应遵循六大原则:公平性、透明性、问责制度、非歧视性、知情同意、合法监视》,尤其是在少数族群识别上识别率差强人意,虽然中国算法公司在这方面做的更好(比如说华云智能),但还不至于领先太多。
非人脸识别:有两种情况是AI企业需要考虑的,不是所有的场景都可以采集人脸信息(主要涉及隐私保护/种族等原因),其次是摄像机没有/不支持采集到人脸。就需要大规模的使用到非人脸识别技术,主要包括ReID(行人再识别)、骨骼检测分析、图像二次识别、特征识别等。
2019,大安防市场落地趋势分析
大安防市场纽豪斯曾经多次定义,主要包括平安城市、雪亮工程、智感社区、交通大脑、城市大脑、交通管控、智慧交通、智慧警务和视频云工程,对于比较成熟的平安城市、交通管控、智慧交通本文并不会细致展开。2019年以下几个趋势是一定要关注的:非人脸识别将大行其道、聚焦垂直行业、聚焦平台级应用、深入了解客户的需求、大数据的开放和整合、两种模式取其一,说的更准确一点纽豪斯更关注公共安全市场(PS,Public Security)。
趋势一、非人脸识别将大行其道
虽然说人脸识别技术已经烂大街了,但还是有一类人脸应用是值得关注的,那就是人脸聚类。
人脸聚类
人脸聚类将是城市级的PS应用,是一定要关注的,从公开报道来看,商汤和依图已经在积极布局。
A.商汤人脸聚类
根据商汤科技公众号报道,香港中文大学-商汤科技联合实验室(MMLab)提出一种有监督的Metric用于人脸聚类,来部分解决无标注数据内部结构复杂、依赖特定Metric、缺乏Outlier控制,以及时间复杂度等问题。目前在人脸的公开数据集标到了百万级别,人脸识别百万里挑一的正确率达到99.9%(MegaFace Benchmark)之后,发现再也标不动了。标注员能标出来的数据永远是简单样本,而人脸识别模型是个“深渊”,当你凝视“深渊”的时候,“深渊”并不想看到你。
时代的人脸聚类,一般采用卷积神经网络(CNN)中提取出来的特征。人脸识别的CNN通常把人脸图片映射(Embedding)到一个高维的向量,然后使用一个线性分类器,加Softmax激活函数和交叉熵损失(Cross Entropy Loss)来训练。
紫色的向量即为人脸特征(图片来自商汤公众号)
这种方式决定了这些经过映射(Embedding)后的人脸在特征空间里分布在不同的锥形(Cone)中(下左图),因而可以使用余弦相似度(Cosine Similarity)来度量相似度。或者如果对人脸特征做二范数(L2)归一化,那么人脸特征则会分布在一个球面上(下右图),这样可以使用L2距离来度量。
图示为2维,实际在高维空间(图片来自商汤公众号)
有了特征和度量标准之后就是如何选择一个聚类算法了。现成的聚类算法包括K-Means、Spectral、DBS、 Hierarchical Agglomerative Clustering (HAC)、Rank Order等以及它们的变种。利用这些方法聚类之后将每一类中的样本分配相同的标签,不同的类分配不同的标签,就可以用来充当训练集了。
使用20万张图提取特征之后来测试一下这些聚类算法,K-Means花了10分钟,HAC花了5.7小时,DBSCAN花了6.9小时, Spectral花了12小时。若使用60万张图片提取的特征来做聚类,K-Means超内存了,HAC花了61小时,DBSCAN花了80小时,Spectral跑到天荒地老之后也甩了一句超内存。当图片数量增加到140万的时候,几乎所有的聚类算法都挂了。
K-Means, Spectral, HAC等传统聚类方法的问题依然存在各种各样的问题:聚类算法具有较高的时间复杂度、通常认为数据分布服从某些简单的假设、通常使用某种特定的Metric、缺乏较好的离群值(Outliers)控制机制。商汤提出了一种有监督的Metric用于人脸聚类,来部分解决无标注数据内部结构复杂、依赖特定Metric、缺乏Outlier控制的问题,顺便还解决了一下时间复杂度的问题(CDP做到了线性复杂度),当然性能也提升了一大截。
CDP本质是学习一个Metric,也就是对样本对(Pairs)进行判断。如下图,CDP首先使用多个人脸识别模型构建成一个委员会(Committee), Committee中每个成员对基础模型中相连的Pairs提供包括关系(是否是Neighbor)、相似度、局部结构等信息,然后使用一个多层感知机(MLP)来整合这些信息并作出预测(即这个Pair是否是同一个人)。
图片来自商汤公众号
这个过程可以类比成一个投票的过程,Committee负责考察一个候选人(Pair)的各方面信息,将信息汇总给MLP进行决定。最后将所有的Positive Pairs组成一个新的Graph称为Consensus-driven Graph。在此Graph上使用简单的连通域搜索并动态剪枝即可快速得到聚类。由于MLP需要使用一部分有标签的数据来训练得到,所以CDP是一种基于有监督的Metric的聚类方法。
在复杂度上,CDP由于只需要探索局部结构,因此除了KNN搜索之外,聚类部分的复杂度是接近线性的。在20万数据上,不计入KNN搜索(依赖别的库)的时间的话,CDP单模型的耗时是7.7秒,多模型的耗时是100秒。在140万数据上,CDP单模型的耗时是48秒,多模型的耗时是585秒。试验结果上看时间复杂度甚至低于线性(小于7倍)。
商汤在实验中使用CDP聚类后的数据加入人脸识别模型的训练之后,可以让模型达到接近全监督(使用Ground Truth标签)的结果。如下图所示:
图片来自商汤公众号
在两个测试集(Benchmark)上,随着数据的增多,用CDP聚类结果训练的人脸模型性能的增长接近全监督模型(所有数据都使用Groundtruth标注)。有趣的是在IJB-A上商汤的结果超过了全监督模型,原因可能是训练集的Ground Truth标签会有一些噪声(Noise),例如误标注,导致全监督模型在IJB-A的某些测试样例上表现不佳。
聚类后的部分结果如下图所示:
每一组代表聚完类后属于同一类(图片来自商汤公众号)
CDP属于一种自下而上(Bottomup)的方法,因此只能感知局部的数据结构。然而感知全局的数据结构对于聚类更为重要,为此,我们最近提出了一种自上而下(Top Down)的有监督聚类方法,能自动学习根据数据的结构进行聚类,更加充分地解决上述传统聚类的问题。聊得再多就涉及商业机密了,有兴趣请关注他们的公众号。
B.依图人脸聚类
依图认为AI有个创新曲线,从2015年的10万人人脸认证到16年的1000万人脸大库识别,2017年发展到20亿人脸大库的识别,这是一个质的飞跃,预期未来能够实现千亿人脸大库的识别,这是一个美好的未来。那么再如此之多的人脸库中找到同一个人,都绕不过人脸聚类这个功能。
依图把人脸识别分为3个时代:
◦1.0监控时代:弱智能
◦2.0识别智能时代:摄像机具有超越人脸的识别能力,代表技术包括静态比对、动态布控,代表应用包括陈年旧案破获、逃犯抓捕等
◦3.0数据智能时代:通过分析人在物理世界的活动规律从而识别精度进一步提高、智能化的发现异常情况;其次就是实现市(省)级人像聚类,以依图目前的技术水平,可以实现1万路、1亿人/天、1年数据、1秒返回,并形成三大基础技战法及各种专用技战法,除了人脸之外还能够实现多维数据碰撞。
依图的观点“数据智能”已经得到业界的主流认可,无疑“数据”是的三要素之一(另外两个是算法和算力)。PS领域极致的算法能力和大数据分析能力是依图的两大当家法宝。尽管如此,依图公司依然可以克服目前监控中广泛存在的阴影、模糊、遮挡、低像素、墨镜等多种情况,通过归档技术,实现高难度照片聚类。
纽豪斯了解到依图的人脸聚类已经在湖南某时落地案例,该项目拥有3000路摄像机、数据保存100天、常口库+抓拍聚类档案总数800+万人、抓拍国人数量2000+万张,助力刑事案件破获占比约35%。
考虑到人脸识别的争议性,在计算机视觉领域纽豪斯更加关注非人脸识别,典型应用包括:图像二次识别、ReID和骨骼检测系统,虽然也有很多其它类型的应用,但最有希望在2019年实现落地的应该集中在这三个方面。
图像二次识别
AI对人类最大的价值来自于两个方面:减少人工节约人力和降低成本。如果AI拥有比“人”更加强大的能力,效果更高的话,相信会得到快速的普及。以典型违章数据处理为例,目前的交通违章均需要通过人工进行二次识别,如果能够采用AI技术进行二次识别,事先将模糊、非违章的照片去除,就可以大大降低人力水平,同样如果把这些技术也用于行人闯红灯警示,而可以大大减少交通事故的发生。
ReID行人再识别
之前的公众号文章我们曾经探讨过ReID,后续还会有一篇专题文章来进一步探讨。ReID是近2年得到迅速发展的非人脸识别技术,华云智能、云从科技和千视通都取得了技术上的突破,并能够实现商用。对与ReID而言最实用的当属以图搜图功能了,有望在2019年得到较大规模的落地。
ReID(Person Re-identification),也称为行人重识别、行人再识别、跨镜追踪,是利用计算机视觉技术判断图像或者视频序列中是否存在特定行人的技术,广泛被认为是一个图像检索的子问题,目前主要应用于安防领域,未来与人脸识别相结合能够应用于更多更丰富的场景。
ReID的优势在于实时分析,对摄像机没有太高的技术要求,我们可以假定一个场景,春运过程中当一位妈妈携带一名子女在购买车票的过程中发生小孩走失的情形,警察在接到妈妈的报警后,通过给妈妈拍照采集人脸,通过同行人找到小孩的人脸照片,再通过小孩的照片用ReID技术进行跨镜追踪,就可能找到小朋友的轨迹,这具有极大的实用价值,避免报案人口头描述不清、无法准确掌握小孩外貌/衣服特征的情况下,尤为管用。
骨骼检测系统
骨骼检测技术和ReID技术有异曲同工之妙,差异在骨骼检测仅检测“骨骼”和衣服的颜色不相关,就可以大大减少颜色特征带来的误报,通过身高、步态、姿势来判断一个人来实现分析,从目前的技术发展来看,已经具备在2019年实现小范围落地的可能性。
人体骨骼关键点对于描述人体姿态,预测人体行为至关重要。因此人体骨骼关键点检测是诸多计算机视觉任务的基础,例如动作分类,异常行为检测,以及自动驾驶等等。近年来,随着深度学习技术的发展,人体骨骼关键点检测效果不断提升,已经开始广泛应用于计算机视觉的相关领域。
趋势二、聚焦垂直行业
主流企业采用矩阵式管理已经非常常见,尤其是在AI圈,既要布局全国市场,设立分公司、办事处,也要布局垂直市场。纽豪斯曾经在公众号(AI智道)发布《城市级大安防项目市场分析报告》,典型的垂直市场包括公共安全(PS,Public Security)和交通(涵盖交通管控和智慧交通),这里不在赘述,对于AI企业落地大安防市场而言,这两大市场是必争之地。
趋势三、聚焦平台级应用
纽豪斯多次和读者探讨城市级大安防应用,这是典型的2G市场,而2C和2B的市场相对分散而不成熟。对于SI而言,只有拥有平台级应用(杀手锏)才能立于不败之地,对于AI企业而言,如果不能拥有自己的大安防平台很难和大型SI拥有讨价还价的能力。尤其是漫天盖地的新闻说,某某城市又建设了一个大脑、一个平台的时候,发现市场机会又被友商撬走了,心里确实很着急。
那么城市级大安防市场的平台应用有哪些?
◦平安城市:联网平台、运维平台、一机一档
◦雪亮工程:除了平安城市的平台,再增加一个网格化平台(一标三实)
◦智感社区:居民信息登记系统、社区综合信息查询系统、社区警务管理服务系统、社区警务管理服务APP、社区综治平台、警务平台、一标三实平台等,目前BATH、东方网力、佳都科技、科达、商汤、旷视、力维等企业均有积极布局
◦交通大脑:城市交通大脑平台,主流厂商包括阿里巴巴、高德、滴滴、方纬科技等
◦城市大脑:城市大脑平台,影响力最大的厂商当属阿里巴巴,大约有10个城市的落地
◦视频云:AI赋能安防最高级的应用当属视频大数据和视频云建设,只有足够多的数据才能够产生更多的应用和技战法,未来的视频监控当属于市级甚至是省级的视频云平台,在2018年已经有较多的落地案例,相信在2019年会出现更多的视频云和大数据平台
◦智慧警务:涉及的平台最多,也最复杂,各警种都涉及多种平台,典型应用包括治安、管控、指挥、侦查、监管等
广东省智慧新警务13847规划图
应用参考:阿里城市大脑3.0
来自雷锋网的报道,城市大脑是技术进步的产物,也是城市发展的产物。综合来说,云数物智技术积累、国家政策支持、本地政府配合、后期庞大城市订单等等因素,促成了天时地利人和的形成。AI、IoT、云计算、数据挖掘、知识管理、深度学习等技术迅速进入爬坡期,互联网科技公司、运营商、硬件厂商参与城市建设有了便捷的通道,但由于智慧城市是一个跨系统交互的大系统,是“系统的系统”,不是硬件的堆叠与软件的重复建设,而是需要有一个中枢神经式的城市指挥系统,这个系统必须具备全面、实时、全量的决策能力——这成为“ET城市大脑”诞生的基础。
2016年10月,云栖大会城市大脑首次亮相,由王坚发布;
2017年4月,城市大脑落地苏州;2017年8月,城市大脑落地澳门;
2017年10月,杭州城市大脑1.0正式发布;
2017年11月,城市大脑入选新一代人工智能开放创新平台;
2018年10月,杭州城市大脑2.0正式发布;
2018年12月29日,杭州城市大脑综合版发布,将进入3.0时代。
雷锋网注意到,城市大脑1.0版本到2.0版本用了整整一年,而2.0版本到3.0版本只花了不到3个月的时间。2013年,闵万里加入阿里任职阿里云机器智能首席科学家,先后打造了ET城市大脑 、ET工业大脑、ET农业大脑等。加入阿里之前,闵万里在Google和IBM工作过,而IBM还是智慧地球的倡导者。
雷锋网注意到,阿里城市大脑团队的重点在公共安全、城市管理、交通治理3大领域。在2018年10月,该团队还在社招一些在自然语言处理(NLP)、知识图谱、机器学习、深度学习、大规模分布式机器学习领域有3-5年研发经验的人才。随着2018年11月阿里云事业群升级为阿里云智能事业群。科学家出身的闵万里在阿里云内部继续承担着打通各个行业大脑数据的使命,用数据智能推动城市大脑的商用。
此外,在阿里达摩院,北京大学应用数学博士,IEEE Fellow华先胜领导城市大脑实验室,主抓城市大脑在视觉方面的技术研究。华先胜的职位是阿里巴巴副总裁、达摩院城市大脑实验室负责人。在城市大脑项目上,闵万里和华先胜的团队紧密合作。
阿里云想的很明白,做好行业大脑必须把握好3个能力:AI能力、云计算大数据能力、垂直行业整合能力。在城市大脑背后的技术架构上,分布着4大平台,涉及与城市交通、医疗、城管、环境、旅游、城规、平安、民生八大领域有关的计算能力、数据算法、管理模型等。在城市大脑视觉AI的项目组成上(这部分由华先胜团队主导),目前分为天曜、天鹰、天机、天擎四个部分。前三部分比较偏应用,最后一部分是平台。
在杭州,杭州城市大脑塑造了经典的案例。作为长江三角洲城市群中心城市之一的杭州,曾经上下班高峰期堵车非常严重,而目前,受益于“城市大脑”,杭州交通效率不断提高。依据公开的城市季度报告,在全国最拥堵城市排行榜上,杭州从2016年的第5名下降到今年第二季度的第57名。2018年9月,杭州云栖大会上,浙江省公安厅副厅长金志在现场宣布:杭州市“城市数据大脑”交通V2.0正式发布。金志表示,杭州城市大脑2.0将覆盖主城区、余杭区、萧山区共420平方公里,一年扩大28倍。接管1300个路口信号灯、接入4500路视频,通过7大生命体征全面感知城市交通,并通过移动终端直接指挥杭州200余名交警。
截止到今天,阿里城市大脑已成为全球最大规模的人工智能公共系统之一,已覆盖交通、安防、医疗、旅游、市政建设、城市规划、工业、环境、政务民生等领域,为阿里也为产业界带来了巨大的经济效益。这些场景中,交通、城市治理、政务民生是最具吸引力的场景。
阿里想紧紧抓住的是智慧城市领域的第一波创业者和研究者,而这种想法在其他厂商中间似乎不多见。雷锋网注意到京东智能城市研究院的成立,引入在计算机、AI、自动化、仿真技术、城乡规划、等方面的6位中国工程院院士,其城市计算平台也在逐渐汇聚产业链上下游的垂直企业。同时,阿里云紧密与专业厂商进行积极合作,对外宣布的包括浙大中控、银江科技、浙江大华、图盟科技等公司,以期望能够将其最新技术注入到传统厂商的方案当中。
趋势四、了解客户的需求才能够有效落地
只有最切近用户需求的应用才能够更有效的落地,任何不落地的AI技术和产品都是没有办法产生利润的。2019年是70周年大庆之年,而2020年正是十三五的收官之年也是十四五的规划之年,也许十四五的规划在2019年就要开始了,对趋势的准确判断将决定未来7年AI企业的命运,所谓运筹帷幄之中,决胜千里之外。
最近参加的论坛、演讲、聚会、年会很多,也多了一些和用户面对面的交流机会。以公共安全市场为例,传统的视频监控系统解决了人盯人的问题,减少了现场的巡逻人员,解放了一部分警力。之后视频监控系统越来越智能,逐渐可以解答“车去了哪里了?”“你是谁?”诸如此类的问题,最早提出来智能应用的起始年应在2013年,大规模进入试用的年份当从2016年开始算起。
虽然人工智能技术、人脸识别技术最近显得火热,但实际上很早已经得到广泛应用,卡口和电子警察是最早实现智能应用的,第一个解决的就是车牌抓拍(典型的人工智能)。2011年之后各省市区逐渐建立了人脸静态大库,开启了人脸识别的算法应用,逐渐试水动态人脸识别算法,不过这个时候四大人脸独角兽企业SKYY还没有诞生或者刚刚起步,一些人脸识别的先驱企业推动了AI技术的应用,不过比较令人失望的是大部分这些企业并没有在AI热浪中崛起,前期的巨额投资在现在看来肯定是要打折扣了。
新的AI企业崛起之后,更多的告诉用户的是实验室的数据、识别率,或者是世界大赛又拿了几个世界第一,过度的宣传或者鼓吹,造成用户期望值的巨大落差,为什么我找了四家、五家世界第一的AI公司还是不能解决我的问题?这是一个误区,企业说的很好做的很差,2019年建议企业还是务实比较好,尽可能做出来的效果就像说出来的效果那般。其次数据安全、网络安全也很重要,这个需要进一步的探索和解决,需要重视,尤其是当视频专网延伸到社区之后,更加需要重视这个问题。
应该怎么做?用户有几个建议。
首先就是平台异构。现在的企业,老死不相往来,排他性很强,总想独霸一个市场。其次就是产品软硬件一体化,把软件固化在硬件中,列硬件参数控标,这样导致用户的机会成本很高,及时第二家公司免费提供产品和服务,客户依然要付出巨大的代价。尤其是大型项目的预算、决算流程涉及多个部门,这些因素都要考虑,即使是最终用户也需要被监督、被审核。最好的方法就是实现平台异构、互相兼容,多算法融合,共荣共生。
其次就是深挖行业深度应用。目前大多数的应用都属于比较浅层次的、容易被满足的需求。因地域性、环境、文化多从因素造成客户的需求千差万别,及时同一个厂家通过定制开发也会形成多个软件版本,最终就出现了难共享、难扩容、难兼容的问题,即使采用了共同的国标进行系统设计,但最终的互联互通只有亲身经理才能够感同身受。基于此很多客户提出了视频云的解决方案,要求引入竞争机制,所有的厂商不管是硬件、算法、算力、数据都放在云端,每家都分配一定的比例,按照共同的标准建视频云,由最终使用者决定用哪家的服务。以算法为例,引入竞争机制,如果平台同时支持SKYY(商旷依云)、HDT(海大天)、云天励飞的算法,每种算法都给推荐结果(TOP 3),由用户决定采用哪种算法,久而久之,竞争机制出现,优胜劣汰,也有助于算法厂商提高自己的算法水平,这实际上也是一个平台异构的问题,也是深挖客户需要的一个应用场景。
数据共享和开放是趋势。做过公共安全市场的读者都知道,现实情况是AI领域应用存在着多个专网(比如视频专网、政务网)和公网(比如互联网),每个网中的数据都不同,网和网之间可能是隔离的、有边界的,故而需要将硬件、软件、数据实现三解耦,把原先错综复杂的数据进行剥离、梳理清楚,之后再推进数据共享,不管现状如何,相信2-3年内这种共享的障碍必将逐渐消除,对企业而言必须实现规划好一旦数据打通后的系统架构问题。
通过云化解决区域发展不均衡的问题。地域经济发展不均衡是普遍存在的,即使是在广东省这样经济发达省份,也存在粤东西北发展比较落后的情况。按照经验,城市级安防项目的建设通常由所在的地市区县财政承担,那么如果统一规划,势必会有部分区域因为资金问题没法建设最新的AI系统或引入最新的AI技术,那么云化就是一种比较好的解决方案。通过建立数据服务器集群、GPU群,多个县、市、区可以供用一个视频云,按需申请、按需使用,如果全省、全市一片云的话,就可以由上级部门统一建设。顺便补充说明的是市县的财政决定视频系统建设的规模,尤其是AI的投入,毕竟属地责任在财政。目前来看广州市、深圳市、杭州市、上海市都走在视频云建设的前列。
用户需求逐渐转向精细化管控。比如发生**件,有关部门希望能够通过AI技术来识别到底是谁在表达诉求?是不是本地人?如果不是,背后是谁?第一时间要掌握,也可以同样适用于医闹。另一类的精细化管控需求包括特定外籍人员精细化管控,我们都知道人脸识别技术在对有色人种识别的时候有着比较低的识别率,到底如何解决?造成了落地困难的问题。其它的精细化管控包括城市到底需要安装多少只AI摄像机?如何布点更有效?安装高度如何?财政支撑的上限在哪里?投资的尽头在哪里?这些都需要精细化考量。
人防、物防、技防,那个更合适?以发达城市平安建设为例,每路摄像机平均投资7-8万元,多采用5-6年BT模式建设,算下来1.2+万元/年/路,1000元/月/路,那么请一个安保人员一个月按5000元工资计算,那个更划算?按照最新的AI投资测算,仅考虑算法每路视频监控的投资大约在1万元,如果建设3万路视频监控AI部分就要投资3亿,如果同时考虑算法+服务器+后台应用,则投资成本可能高度3+万元/路,这还是在新增深度应用不足的情况下,如果引入更多的AI应用,也许需要更多的钱。
好消息是2019年是PS行业信息化建设的关建年,AI企业还有很大的机会。2019年是视频云大规模建设的一年,2018年之前已大量建设了基础设施,之后就要充分挖掘视频系统的潜力。
那么针对用户的需求,推进AI安防工程化落地有什么更好的解决方法吗。合理的控制成本、确保交付的质量、全面整合数据、精细化的深挖客户的需求。多了解需求的场景,比如重点关注的昼伏夜出、同行人、特定区域/时间的计算等。构建高效的计算框架,提供系统的识别率,了解当前客户的现状解决系统的落地,否则都是空话。
趋势五、大数据的开放和整合
在AI赋能安防的大背景下,主要应用在计算机视觉,那么毫不夸张的讲,未来的格局得摄像机者得天下、得摄像机的得数据,这是对AI而言。我们都知道公共安全领域的有四侦:图、刑、技、网,四侦合一一直是努力的方向,并向合成作战方向迈进。制约数据共享和开放的因素一直都存在,故而警务大脑的商机若隐若现,但机会只留给准别好的人。最早看到商机的当属Huawei安平BG,他们的战略就是“长期战略投入,做深做透PS行业”。
城市级的视频大数据一旦被充分挖掘,再整合多个维度的开放数据,其潜力和前景都是值得提前布局的。
趋势六、两种模式取其一
在AI企业如何落地这个问题上,有两个模式可以参考。
A模式:系统做大了就得做总包,做中标人,这是阿里模式。以城市大脑为例,在2018年多采用单一来源方式招标,系统技术实在是太新了、太复杂了,很难找到第二家供应商。
H模式:自己供设备、软件和系统,让生态链企业去做,这是Huawei模式。这个前提是企业的产品要足够好,可以被集成,也将是未来竞争最激烈的、多方博弈的市场。
还有第三种模式吗?A+H模式,我们期待这样的企业出现,在传统安防市场上曾经出现过像Tyco、Siemens、Honeywell、JCI这样的企业,确实走的A+H模式,但貌似在中国都不太成功。
2019,未来市场预判
2019其实就是为2020年做准备的。未来市场会出现各种的变局,这篇文章里我们仅探讨几个。
数字视网膜
中国工程院院士、中国计算机学会理事长高文早在2018年(或者更早)就提出了数字视网膜的概念,纽豪斯在雷锋网举办的首届中国人工智能安防峰会上聆听了高文院士的演讲,其后在多个场所多次听到数字视网膜,其独特的观点和技术领先性值得深思和参考,而且数字视网膜和鹏程实验室、深圳龙岗智能视听研究院也有关联,这也是纽豪斯感兴趣的。
根据雷锋网的整理报告,数字视网膜分为传统的高效视频编码和实时特征提取两部分。高院士认为现在的视频监控系统,从一开始就面临数据量太大、存储量太大,查找数据不易等一系列挑战,这些挑战可以归纳成三个问题:难存储、难检索、难识别。这种新型的数字视网膜可以被称为慧眼,这种慧眼不仅能看,还能够感知。如果整个社会均由这种慧眼构造成,那系统会非常强大,智慧城市和公安公共视频的处理也会变得更加得心应手。
图片来自雷锋网
实际上承载数字视网膜的摄像头能做两件事:做好编码,为后面的识别提取出需要的信息。如果把识别算法直接放在摄像机里,会存在问题。摄像机做的事应该是提取特征,把后面可能用到的模式识别的特征提取出来。当然,也不能用一个摄像机把人脸和汽车等所使用的具体系统的私用特征全部提取和传输,因为这些特征加在一起可能比原来的一个码流还大,相当于传两个码流。
如何解决这个问题?用数字视网膜。实际上人的眼睛原理和数字视网膜很相似,我们看东西时传给大脑的信息,实际上并不是具体地实打实的物体影像,而是视网膜给后脑传输了生物特征,在后脑完成。
图片来自雷锋网
数字视网膜与人的眼睛既具有影像重构(精细编码视觉内容),又具备特征提取(面向识别理解)的功能。原则上这一部分把高效、监控视频编码(视频特征的紧凑表达),把这些特征集合起来变成紧凑地给它表达出来就叫做“紧凑表达”。它用了原来同一个码流解决了两件事,但前提是视频编码略微会有点损失,但它对识别结果的提升比不用这种方式要高很多倍。
数字视网膜包含了四项核心技术:
◦基于背景模型的场景视频编码
◦视频同步描述整个表达的记录
◦在保证性能的时候,用同一个码流把视频和特征原有编码都传出去
◦云端的检索,对视频进行更加合理的描述,以便用于搜索
图片来自雷锋网
数字视网膜的创新之处就是在传统的视频传输信号之上叠加了特征编码信号,不管企业是否接受,这都是未来不可逆的发展趋势,数字视网膜的落地需要标准化,而标准化和两个机构有关:鹏程实验室、深圳龙岗智能视听研究院。
2017年12月22日,广东省正式启动建设首批4家广东省实验室,深圳网络空间科学与技术广东省实验室就是其中之一。2018年1月19日,深圳市举办了实验室筹备工作会议,召集国内相关领域的权威专家院士开始筹建实验室。3月31日,实验室启动大会在深圳市召开,中国工程院院士高文被聘为实验室主任,鹏城实验室正式对外公开亮相。实验室整体规划土地使用面积134万平方米(即2000亩),建筑面积150万平方米,一期建设用地规划在南山区石壁龙片区。建设期间,实验室启动过渡场地位于大沙河创新走廊的核心发展片区——留仙洞战略性新兴产业基地万科云城一期8栋,建筑面积5.3万平方米。
纽豪斯通过官网了解到,鹏城实验室以哈尔滨工业大学(深圳)为合作单位,协同北京大学深圳研究生院、清华大学深圳研究生院、南方科技大学、香港中文大学(深圳)、深圳大学、中国科学院深圳先进技术研究院、华为、中兴、腾讯、中国电子、国家超级计算深圳中心深圳云计算中心、中国航天、中国移动、中国电信、中国联通等十余家高校、科研院所、企业等优势单位共建。目前设有网络通信、先进计算和网络安全三个研究方向,分别由中国工程院刘韵洁院士、高文院士、方滨兴院士任方向责任院士。
高文院士担任主任,那就很有可能催成数字视网膜在鹏程实验室的落地。根据最新消息2019 年 1 月 23 日下午,鹏城实验室人工智能国际研发中心揭牌仪式在深圳市福田区深港协同创新中心举行。作为鹏城实验室参与全球人工智能研发的桥头堡,首批3个高水平国际化项目已全面入驻。项目分别涉及智慧金融理论研究(沈向洋负责)、智慧金融应用研究(杨强负责)以及自主健康研究(Ramesh Jain负责)。
在鹏程实验室成立之前的2017年7月26日,深圳市龙岗区政府与北京大学数字视频编解码技术国家工程实验室、中关村视听产业技术创新联盟,在深圳市举行深圳龙岗智能视听研究院签约暨揭牌仪式。北京大学数字视频编解码技术国家工程实验室和中关村视听产业技术创新联盟由高文院士牵头组建,是自主创新的AVS标准的核心推动力量,也是新一代人工智能规划的积极参与者之一。而这个试听实验室也和高文院士有关。
两大机构的联系人是李革博士,国家特聘专家,北京大学数字视频编码技术国家工程实验室深圳分室负责人、鹏城实验室人工智能研究中心主任。美国奥本大学电子工程博士学位、美国加州大学戴维斯分校电子工程博士后。相信在李博士的联系下,数字视网膜的标准有可能在两大机构的助推下实现落地。另据悉深圳龙岗智能视听研究院投资设立深圳龙岗智能视听技术有限公司,副院长是安欣赏,领英资料显示安毕业于大连理工大学,毕业后加入华为公司,服务超过16年。
多维数据融合
数字视网膜解决了视频流的传输和特征结构化问题,获取了如此之多的结构化视频数据之后,就需要将视频数据和其它数据进行碰撞,也就是多维数据融合。
以人脸识别为例,如果摄像机采集到了一个人脸,但是系统是无法告知“他是谁?”,这需要一个庞大的基础人脸库(比如身份证大库)进行1:N的比对,这个人脸库就属于多维数据融合的典型应用。又好比说,系统采集到一个手机的MAC地址需要和一张人脸进行匹配,也是一种数据的融合。又好比将一条门禁刷卡记录和人脸照片结合起来。
现实的情况将会更为复杂,城市治理的核心就是人的动态,捕捉人动态最好的方法就是利用遍布城市的摄像机。那么未来如何打破壁垒,将摄像机采集的数据和其它多维数据进行碰撞、融合,就很有必要成立一个大数据协调机构来完成,也可能需要一网多域的管理方式进行管理。
其它落地因素
影响2019年AI项目落地的因素很多,还有几个因素是需要考虑的。
◦根据主流观点,摄像机视频前端预计1-2年(2019-20)内不会大规模增长,这是财政负担越来越重,好钢用在刀刃上,但AI摄像机在整个摄像机中的占比将会有较大幅度的提升
◦大规模的建设需要等待视频监控十四五规划,相信2021-25期间肯定会有大规模突破
◦广大的乡村和乡镇,偷鸡摸狗的依然存在,随着城市化进程的推进,乡村的空心化、老龄化日趋严重,人防越来越难了,而利用AI技术提高乡村和乡镇的安全性已经迫在眉睫
◦尽管财政负担很重,2019年AI依然会保持大规模投入
◦市场整合力度会越来越强,互联网+停车场、互联网+门禁、智慧社区的标准都在推进制定中
以上并不全是纽豪斯的观点,部分观点也是来自于第三方的沟通。
2019,AI企业一定不会一家独大、独占区域市场,一切才刚刚开始。
时间:2019-02-09 14:41 来源: 转发量:次
声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
相关文章:
相关推荐:
网友评论: