李飞飞等人的新研究，可能让人工智能真的不需

　每一个你想象不到的地方，有着大量的数据标注员。他们手动在图片里把每一只花瓶和每一辆汽车框出来，并且标上“花瓶”和“汽车”。一段时间后，这些人把成千上万张标记好的图片打包，发送给远在北京、上海甚至旧金山的 AI 公司。GQ 将这些人称为《那些给人工智能打工的人》。

　　人工智能发展迅速，大大小小的互联网科技公司相继开展研究，投入商用。然而训练一个可用的 AI，需要大量准确标记好的图片、视频等资料。

　　正因为此，市场对数据标注的需求如此之大，吸引“那些给 AI 打工的人”争相加入，其中不乏原来找不到工作的闲散人员——毕竟这份工作只需要动动鼠标，用不上太多知识。

　　但是，恐怕不久后，这些人就将再次失业。

　　上周，来自约翰·霍普金斯大学、斯坦福大学和 Google 的专家联合发布了一篇论文，介绍了他们使用神经网络来自动搜索神经网络，将其投入图像分割方面的研究，并且取得的重要进展：

　　研究人员采用神经架构搜索 (Neural Architecture Seartch, NAS) 技术设计了一个神经架构 (A)，放任它去自动搜索/设计出新的神经架构 (B)，投入到图像语义分割 (semantic image segmentation) 的任务中。

　　研究人员发现，这个被自动搜索出来的神经架构 B，在主流的小规模图像数据集上，未经训练就直接使用，表现已经超过了现有人类设计的、预先训练好的模型。

　　以往人们一直相信，设计 AI 需要大量知识和经验，简而言之就是需要人来设计。

　　但现在，AI 设计出的 AI，已经比人设计出的 AI 更强。

　　论文的标题叫做： Auto-DeepLab: Hierarchical Neural Architecture Search for Semantic Image Segmentation

　　研究人员将这个能够自动搜索（设计）神经架构的技术命名为Auto-DeepLab。这个名字来自于 DeepLab，Google 人工开发的图像语义分割技术。前面加上 Auto，意思是在 DeepLab 的基础上，新的技术可以实现了很大程度的自动化。

　　论文署名作者当中，两人来自约翰·霍普金斯大学，其中第一作者是 Chenxi Liu，曾在 Google 实习；有四人来自 Google；剩下的一人来自斯坦福大学，正是原 Google Cloud 首席科学家，在计算机视觉学术和业界知名的李飞飞教授。

　　“本着 AutoML（编者注：Google 主导的 AI 计划，将算法选择，模型的超参数调整，迭代建模和模型评估等工作自动化。）和人工智能普及化的精神，对于不依赖专家经验知识，自动设计神经网络架构，人们的兴趣有了显着提升。”作者提到。

　　在“AI 自动设计 AI”这件事上，Auto-DeepLab 有几个比较重要的新尝试。

　　首先，神经架构搜索 NAS 技术是 AI 领域的新兴物种，主要用于简单的图片分类。而在这篇论文里，研究者首次尝试将 NAS 投入到高密度的图片预测任务上（也就是对更复杂的高分辨率图片进行语义分割，比如 Cityscapes 城市街景数据集、PASCAL VOC 2012 和ADE20K 等数据集）。

　　其次，在计算机视觉领域内的神经网络架构，通常分为内层、外层的两级架构，自动化的神经架构设计往往只能设计内层，外层仍需要人来设计和手调。而 Auto-DeepLab 是第一个让 AI 掌握外层设计和调参能力，并在图像语义分割任务上得到优异结果的尝试。

　　“图像语义分割”六个字听上去有点拗口，其实很好理解：对于一张图划分几个类别，然后将所有的像素点归类。

　　比如下面这张图，可以简单分为三类。图像语义分割的任务，就是判断每一个像素点属于人、自行车，还是背景。