AI社区有多排外？「外行人」观点引发争议

近年来发展迅猛，也引起了很多其它领域研究者的关注。越来越多有关 AI+传统领域的研究正出现在 Nature、Cell 等重要期刊上。然而隔行如隔山，对于其它行业的人们来说，AI 研究社区似乎并不如看起来那么友好。

近日，蒙特利尔 Jewish General Hospital 的生物统计学家 Alexia Jolicoeur-Martineau 在社交网络中抱怨 AI 研究社区排外，吐槽 Yoshua Bengio 的言论引起了业内人士的注意。AI 领域的学者 Ian Goodfellow 等人纷纷表示关注。众所周知，领域能有今天的发展离不开开源、arXiv 分享精神的帮助，但这次讨论给了我们从另外一个角度看待问题的机会。

值得一提的是，在成为医疗行业的科学家之前，Alexia 自己有计算机科学和统计学背景(她有数学和计算机学士学位，以及统计硕士学位)。

Alexia Jolicoeur-Martineau 的 Twitter 内容如下：

我们需要讨论一下这一问题。我把其他 AI 研究者(有的来自蒙特利尔，有的不是)也拉入了讨论，因为我认为这个问题非常重要。

这个问题不止关乎蒙特利尔，还关乎整个 AI 生态。

除了诟病一些小的沟通问题，人们总是在赞美这个社区的伟大，但没有人注意到这个社区有多么封闭、排外。

在小组讨论中，我只听 Yoshua Bengio 提过一次「NGO」(非政府机构)，学界和业界是最常出现的两个字眼，好像这个社区非此即彼。事实并非如此，NGO 是存在的，里面是一些因为不堪忍受学术界虐待/盘剥而出走的人。

或者仅仅是因为他们无法解决政治和环境问题(此类文章比比皆是)。因此，许多人像我一样屡次尝试申请读博，但还是被拒之门外。

如果其他像我一样有 10 篇统计学方面的论文(8 篇已发，其中两篇是第一作者)和 2 篇 AI 方向论文(未发表)的人也屡次遭拒，那么这说明一个问题：一大批才华横溢的人才被拦在这个社区之外。

如果绝口不提这些人，也不考虑将其纳入讨论小组，那么我们相当于假装他们并不存在。有人提到了这一漏洞百出的流程，说想要申请读博非常困难，Joelle Pineau 的答复是这一问题将尽快得到解决。

Pineau 提到了另外的 20-40 个博士点。很抱歉这并不是问题的解决之道。她还提到有 300 人申请他们的 GAN 研究项目，她说，申请者或许应该转向其它更有趣的项目。

这表明她不会再接收 GAN 方向的申请者。这点合情合理，因为决定接收谁做自己的学生是她的权利，但这表明这一领域门槛很高，仅仅增加几个名额并不能解决问题。

在这 300 个对 GAN 感兴趣的申请者之中，可能有 50 个天分极高的人才不得不停止该方面的研究，转而投向其它不相关的岗位或产业。

我们失去了那么多乐意在学界之外进行科研(不计报酬)的人才。但在研讨小组中我们连他们的存在都没有提到，这更加重了 AI 社区生态的封闭、排外感。我们至少应该承认这一点!

我坚信，以后有了基本收入之后，这些研究人员即使不在学术界也会做研究;同时，还有很多 AI 的业余爱好者在空闲时间进行 AI 方面的研究，我们不应该因为这些人没有华丽的头衔而忽视他们。

我的建议是，在学界之外创建一些尽可能国际化的 AI 实验室，里面没有论资排辈，任何人都能提出项目，并/或成为一名 PI(不需要任何华丽的头衔)。如果大家对这个主意感兴趣，我很乐意继续展开。

我没有足够的资金启动这样一个艰巨的项目，但我坚信这才是未来，我们需要停止维持这个社区一切都好的假象，不再假装那些学界、业界之外的人不存在，或拒绝承认他们是「真正的研究者」(虽然没在讨论小组中听到过，但之前听到很多人这么说)。

Alexia 希望申请 GAN 方向的博士遇阻，她的遭遇引起了 GAN 发明者 Ian Goodfellow的关注：

来自一家医院的生物统计学家正在抱怨融入 AI 研究社区的困难，她既不属于人工智能学界，也不属于工业界。

其他人或许就没有这么冷静了，Alexia 的观点在 Reddit 上引发了热烈的讨论，其中不乏对于机器学习界长篇大论的辩护。

BeatLeJuce 对此表示：

就我所知，机器学习是一个最为开放、包容的研究社区之一——但现在人们都被惯坏了，因而忽略了这一点。明确点说：几十年来，人工智能社区一直在努力，所以我们的研究成果对每个人都是可望又可及的。现在我们的大部分研究都在 arxiv 上免费分享，大部分代码也都在 GitHub 上分享。ICLR 是第一批试图通过创建 openreview.net 来公开进行审查的大会之一。

我们大部分书也是免费的，比如 Goodfellow、Mackay 和 Tibshirani 等人的书。第一批成功的 MOOC 是由机器学习者开设的，第一批高影响力的 MOOC 平台也是由机器学习者创建的：吴恩达和 Koller 创办了 Coursera，Thrun 创办了 Udacity。你甚至可以在推特上给世界一流的研究人员发消息，并与之展开这样的讨论。所以，我认为机器学习站在了无障碍研究的前沿。

我们并没有故意去孤立任何人，也没有把任何参加科学领域活动的人排除在外。有人抱怨过因为没有博士学位而不得参与高能物理研究社区吗?或者计算机架构社区吗?又或者其它任何研究领域吗?如果你想写一篇关于量子化学的论文，直接写就好，没人会阻止你。但如果你想参与该研究领域的讨论，你得让其他量子化学家相信你的研究有价值。就这么简单，机器学习同样如此。

对此，唯一的问题是：1)ML 非常火热非常潮，每个人都想加入;2)在 ML 中，我们总是尽己所能地让所有材料和信息对其他人开放，所以人们以为入学门槛很低，即使没受过正规教育，他们也能实现这些。但事实是，大多数时候，人们确实缺少正规教育，因为有很多技能 MOOC 还没有传授：如何写好 ML 论文，如何区分质量高的论文和不怎么样的论文。

理论上来说，你当然可以参与 AI 研究，即写自己的论文。而如果它被拒收了，那说明有 3 个人看过并且都认为它不够好。这很可能意味着这个想法或者研究方案不符合标准。的确，也许 5 或 10 年前，如果你在 CIFAR 或 MNIST 取得了好成绩，一次没有理论依据的简单黑客攻击可能会给你带来一篇不错的论文。但现在不会了，因为这个领域已经成长了。所以，如果你读了旧论文并认为「我本来可以这么做」，那你可能是对的。但要记住，情况已经大不一样了，这些论文中的大部分现在已没法实现。

论文评审会要求清晰的解释、误差条和理论依据等等，因为我们要弄清楚什么是真正有效的，以及为什么有效。我们不是想刻薄，而是想彻底弄清楚。我们是科学界，这是我们的工作。虽然你不一定非得有博士学位才能成为科学家，但有个博士学位确实有用。即使有些科学家没有博士学位，但请你明白!这些人是非常特殊的存在，在整个社区里占很小的比例。以 C. Olah 和 Dyson 为例子的人可以滚蛋了，因为这些人显然不明白这二者是怎样特别的存在。对于普通人来说，规则很简单，且相当直接：如果你想成为科学家，那就接受对科学家的培训——取得博士学位。

我知道，有些人抱怨说博士学位很难获得，我也听到了这样的声音。这个领域现在非常流行和热门，所有一些有名气的人会被博士申请洪流给淹没。你听得没错，洪流!所以，有时候进入一个好的研究所没那么容易，因为我们既没有时间也没有资源来接受所有申请人。这意味着，有些人即使有实力，也可能不会被接受。这很糟糕，但对此我没有任何解决办法。

但要求我们「更包容」有点牵强。我认为我们已经足够包容了，而且我在开头就提到了这一点。我们非常欢迎每一个社区之外的人向任何 ML 会议提交其研究报告。如果你的论文足够好，你就能够发表它。如果不是，那请你做得更好。很抱歉，我们没时间教你如何写好论文和进行适当的实验，因为我们已经被学生给淹没了。

john_8_32_表示：

这种想法太荒谬了，就相当于在说我的申请被拒了，所以整个博士申请系统都很糟糕。我很同情那些申请被拒的人，他们也是一心想成为科学家，但这一领域已经被炒得太热了，而且研究院名额有限，无法满足这么大的需求。学术界确实有太多太多的问题存在，但除了研究院压力过大使得研究人员精疲力竭之外，我不觉得她指出的问题戳中痛点。

统计学和机器学习是非常不同的领域，有着不同的目标和标准。我看了她的论文，看起来是挺不错的统计学论文，但论文得以发表在另外一个领域并不能说明她的 ML 论文有多好。一些终身教授的论文也经常被拒。很明显，同行评审是有瑕疵的，但这种言论是相当奇怪的。同时也给一丝鼓励：我认为被拒有助于写出更好的论文，而不是世界末日。

确实，在资源有限的世界，即研究所里，「门槛」对于资源分配是有必要的。

处于学术界和工业界之外的人们的研究成果基本上没有发表。科学是让人们分享知识的社区，如果不能读到你的论文，没有人会感受到你的影响力。从科学的角度来说，你或多或少是不存在的。这点说起来很令人难过，但这就是我们积累知识的方式。

Alexia 的遭遇并不是罕见的例子，同样投身医疗领域的 noelsusman 表示：

我是一名肄业博士生(提前退学了，目前拥有硕士学位)，现在在一所医院研究机器学习。

我认为学术界已经遭到破坏，但不是因为原贴中提到的任何一个因素。从医疗界的角度来看，我们是有太多(而不是太少)的人在做研究。作为一个群体，我们并没有好好利用那群涌入到 GAN 研究的人们的成果。

我所在的这家医院仍然在使用简单的启发式方法来评估再入院风险。我们目前所处的阶段，只要拟合一个 logistic 回归到一些基础的诊断数据就能显著改善原来的状况。但这并没有发生，因为我们有太多这样的问题需要解决，却没有足够的人手。这是个很困难的问题，因为(a)医院没有用不完的资金;(b)我们的人力资源不足，因为薪资水平竞争不过技术公司。在街对面就有这样一家公司，我能在那里做相同的事情并拿到多 20% 的薪水。

我确实希望有更简单的方式让外行人进入学术界。我现在在做的研究是新颖的、可发表的，并且我也乐意分享，但我不知道如何解决更大的问题。