【AI】IBM AI再战人类辩手,输了!复盘全程精彩
美国旧金山当地时间2月11日,曾在去年6月完胜以色列辩论冠军的AI辩手——IBM Project Debater重出江湖,对战2016年世界辩论决赛选手、毕业于牛津大学的Harish Natarajan。
本次比赛在位于旧金山的IBM Think会议上举行。双方围绕“政府是否应该资助学前教育”进行激烈交锋。
从AlphaGo接连战胜国际围棋冠军,到AlphaStar在星际争霸2将人类对手杀得片甲不留,AI一直在挑战新的高峰,不断刷新战胜人类的历史记录。
可惜这一次,AI落败。
不过,如果你以为这个AI系统只是个辩论机器,或者只是个帮助人类补充逻辑思维的工具,那你就有点天真了。这只是IBM宏伟野心刚刚拉开的序幕。
▲人类冠军辩手Harish Natarajan与IBM Project Debater进行辩论
一、人类首次辩赢AI
这场辩论采用传统美式辩论规则:双方在开场15分钟前得知辩题,辩论分为三回合,前两回合每人4分钟,第三回合2分钟结辩陈词。
最终结果由现场800位观众投票决定。在开场时,观众会根据辩题进行第一轮的投票,然后在辩论结束时再次投票,哪一方的跑票数更少,哪一方就是冠军。
这种投票方式可以避免辩题本身对观众产生的倾向性,使得辩论胜负的判断更为公正。
本轮辩论,IBM的AI系统Project Debater为正方,人类辩手Natarajan站反方。在辩论前的投票中,79%的观众同意政府应资助学前教育,即Project Debater所在的正方的观点,13%的观众选择了不同意。
Natarajan拥有多个辩论赛冠军的世界纪录,参加过三次世界锦标赛,并在2012年赢得了欧洲锦标赛冠军。在得知辩题后,Natarajan快速将思考潦草地记在纸上。
IBM的研究人员们就像看自己的孩子参加演出一样,在台下时而大笑时而紧张。
▲IBM Project Debater
在打比赛之前,Project Debater完全不知道辩题,但它展示出即时且富有逻辑的语言组织能力。
作为辩题的正方,Project Debater主要围绕资助学前教育对社会的意义展开论证,具体观点包括可使贫困人口受益,让学生获得成功、促进整体教育、提升社会公平、以及降低犯罪率。
Project Debater在论证时多旁征博引,从离线数据库、语料库中调用广泛的资料来源,其中包括国家早期教育研究所和疾病控制与预防中心。
但令人感到稍有遗憾的是,在驳辩(Rebuttal)环节,Project Debater未能突破既有立论观点,除了更多地铺陈外,并未作出有力的反击。
与此同时,人类辩手Natarajan却表现地相当精彩,他认为学前补贴可以在其他地方更好地用于帮助处境最不利的人,并连续抛出“基于市场现实,补贴将消耗中产家庭的财政资源”、“资助学前教育并不意味着让所有孩子都上学”等富有说服力的论证。
最终投票结果是,62%的观众支持正方,30% 的观众支持反方,因为反方的跑票数更少,Natarajan为人类摘下了辩论界人机大战第二战的桂冠。
二、虽败犹荣,AI背后的技术不容小觑
尽管Project Debater输了,它的表现依然令人印象深刻。
在圆桌环节,Natarajan如是评价这一强大的AI系统:“她能有效理解信息,能通过从后台数据库中提取研究材料,将这些信息快速整合,并流畅地表达出来,如果将这样的技能与人类技能相结合,将会有效地提升决策力。”
▲从左到右:IBM Research的Project Debater首席研究员Noam Slonim,IBM Project Debater,IBM Project Debater项目经理Ranit Aharonov,人类辩手Harish Natarajan
这个搅动辩论界风云的Project Debater由IBM Research所研制,它是一个具有幽默感、小巧机智和偶尔有强有力的论点的实验性会话AI系统,也是第一个可以对复杂话题进行辩论的AI系统。
要知道,让机器辩驳人类逻辑绝非一件易事。
和拥有预先定义规则的棋盘游戏截然不同,AI辩手必须适应人的理性和思考逻辑,并提出人们可以理解和接受的论点。
它除了要具备从海量凌乱的非结构化人类语言数据库中检索并提取所需知识的能力外,还要具备坚持自己论点、快速组织逻辑结构、避开语法错误以及预测和反驳对手论点的能力。
美国时间2018年6月18日,Project Debater首度亮相,并在和人类的首场大战中告捷。Project Debater与2016年的以色列国家辩论冠军Noa Ovadia、以色列国际辩论协会主席Dan Zafrir分别以太空和医疗辩题进行了辩论。
▲从左到右:IBM Project Debater,以色列国家辩论冠军Noa Ovadia,以色列国际辩论协会主席Dan Zafrir
当时IBM Research首席调查员兼Project Debater的创造者Noam Slonim称,这一AI系统的训练早在六年前就开始,直到两年前才有能力参与与人们的辩论。
Project Debater拥有数以亿计的论文、报告和新闻文章的庞大数据库。通过消化这些数据,Project Debater可以就特定主题做出逻辑结构良好的演讲,提出清晰明确的论点,并对对手观点进行反驳。
过去六年来,IBM以色列海法实验室领导的全球IBM研究团队研究了数十篇研究论文中记载的许多创新技术,最终赋予了Project Debater三种功能,每种功能都在AI方面开辟了新的天地:
1、数据驱动的语音编写和交付功能;
2、听力理解能够识别隐藏在人类连续冗长的自然语音中的关键主张,并构建有意义的反驳;
3、系统的模拟人类困境,基于一个独特的知识图谱,提炼出原则性的论点。
最终,当Project Debater站上辩论场,它已经是一台拥有渊博知识和超强逻辑的颇为“成熟”的辩论机器。
IBM Research的Project Debater首席研究员Noam Slonim表示,自去年6月以来,他们一直在努力改进系统,Project Debater的数据来源已经扩充到2018年年底的数据。
当然,在和人类交锋时,Project Debater也露出了一些破绽。
比如8个月前和人类的首场辩论赛中,Project Debater当时出现些许不是很自然的叙述以及夸张过激的言论。再比如在本场辩论赛中,“进化”过的AI系统在驳辩环节困守于固有观点,没有做出新的突破。这些问题都需要研究人员持续研究和改进。
三、IBM的星辰大海:“无偏见”的辩论机器
IBM(国际商业机器公司)这位年逾百岁的蓝色巨人,不仅堪称科技界的教父级公司,更是AI系统的开山鼻祖。
1962年,IBM展示了全球第一个语音识别设备Shoebox。
1997年,IBM的深蓝系统vs国际象棋世界冠军卡斯帕罗夫,是世界上最早以机器胜利告终的人机大战,比击败柯洁的AlphaGo还早了19年。
2001年,IBM的沃森系统在在美国老牌智力问答节目《危险边缘(Jeopardy!)》打败了最高奖金得主布拉德·鲁特尔和74场连胜记录保持者肯·詹宁斯,赢得100万美元奖金。
而Project Debater出生的使命,也不只是为了和人类打辩论赛。
根据IBM研究人员Noam Slonim和Ranit Aharonov的说法,辩论只是对该技术的有趣展示方式,而Project Debater真正力量将是其展现无偏见论述的能力。
语言充满了魅力,亦处处是陷阱,当人类被情感和偏见左右,看问题的角度很难做到完全的真实与客观。
IBM希望做到的,是在充满错漏和片面信息的时代,通过推动AI在语言和推理的进步,帮助人们建立充分知情的论点,产生更为公正的结论,并做出更好的决策。
当然,这一目标的实现过程充满荆棘。数据库本身就是个难题,Project Debater所使用的原始数据来自人类的作品,这些数据仍然会包含作者的情感和偏见。
IBM研究人员Noam Slonim曾透露他们解决偏见问题的做法。他们为AI系统设置了一个置信度阈值,如果AI对其论述感到自信,它会创建一个更复杂的陈述;如果感觉不那么自信,那么陈述就会相对简单。
结语:AI踏上新的征程
这场辩论赛,AI输了,这说明在语言和推理领域,人类依然保有优势,而AI还没有真正地准备好。
虽然AI尚且并不能完全和人类相提并论,但从Project Debater的表现来看,我们正在见证互动性AI系统的持续演进。
毫无疑问,在快速地成长中,这一变革性的AI系统将以更敏锐的反应速度给出流畅的思辨,并将提出更加贴近公正事实的观点。
正如IBM研究主管Dario Gil所言,Project Debater存在的目的不是为了击败人类,而是探究如何通过信息交换和有效交流实现人机合作,提升决策效率和科学性,真正推动AI系统的疆界,更好地理解人类。
AI和人类,谁输谁赢其实并没有那么重要。AI背后的技术以及如何帮助人类做出更加明智的决定,这些才是我们应当关注的焦点。
时间:2019-02-16 23:09 来源: 转发量:次
声明:本站部分作品是由网友自主投稿和发布、编辑整理上传,对此类作品本站仅提供交流平台,转载的目的在于传递更多信息及用于网络分享,并不代表本站赞同其观点和对其真实性负责,不为其版权负责。如果您发现网站上有侵犯您的知识产权的作品,请与我们取得联系,我们会及时修改或删除。
相关文章:
相关推荐:
网友评论: