美国旧金山当地时间 2月 11 日,曾在去年 6 月完胜以色列辩论冠军的 AI 辩手——IBM Project Debater 重出江湖,对战 2016 年世界辩论决赛选手、毕业于牛津大学的 Harish Natarajan。

本次比赛在位于旧金山的 IBM Think 会议上举行。双方围绕“政府是否应该资助学前教育(Whether goverment should subsidize pre-schools?)”进行激烈交锋。

从 AlphaGo 接连战胜国际围棋冠军,到 AlphaStar 在星际争霸 2 将人类对手杀得片甲不留,AI 一直在挑战新的高峰,不断刷新战胜人类的历史记录。

可惜这一次,AI 落败。

不过,如果你以为这个 AI 系统只是个辩论机器,或者只是个帮助人类补充逻辑思维的工具,那你就有点天真了。这只是 IBM 宏伟野心刚刚拉开的序幕。

IBM AI 再战人类辩手,输了!复盘全程精彩-黑科技

▲人类冠军辩手 Harish Natarajan 与 IBM Project Debater 进行辩论

人类首次辨赢 AI

这场辩论采用传统美式辩论规则:双方在开场 15 分钟前得知辩题,辩论分为三回合,前两回合每人 4 分钟,第三回合 2 分钟结辩陈词。

最终结果由现场 800 位观众投票决定。在开场时,观众会根据辩题进行第一轮的投票,然后在辩论结束时再次投票,哪一方的跑票数更少,哪一方就是冠军。

这种投票方式可以避免辩题本身对观众产生的倾向性,使得辩论胜负的判断更为公正。

本轮辩论,IBM 的 AI 系统 Project Debater 为正方,人类辩手 Natarajan 站反方。在辩论前的投票中,79% 的观众同意政府应资助学前教育,即 Project Debater 所在的正方的观点,13% 的观众选择了不同意。

Natarajan 拥有大多数辩论赛冠军的世界纪录,参加过三次世界锦标赛,并在 2012 年赢得了欧洲锦标赛冠军。在得知辩题后,Natarajan 快速将思考潦草地记在纸上。

IBM 的研究人员们就像看自己的孩子参加演出一样,在台下时而大笑时而紧张。

IBM AI 再战人类辩手,输了!复盘全程精彩-黑科技

▲IBM Project Debater

在打比赛之前,Project Debater 完全不知道辩题,但它展示出即时且富有逻辑的语言组织能力。

作为辩题的正方,Project Debater 主要围绕资助学前教育对社会的意义展开论证,具体观点包括可使贫困人口受益,让学生获得成功、促进整体教育、提升社会公平、以及降低犯罪率。

Project Debater 在论证时多旁征博引,从离线数据库、语料库中调用广泛的资料来源,其中包括国家早期教育研究所和疾病控制与预防中心。

但令人感到稍有遗憾的是,在驳辩(Rebuttal)环节,Project Debater 未能突破既有立论观点,除了更多地铺陈外,并未作出有力的反击。

与此同时,人类辩手 Natarajan 却表现地相当精彩,他认为学前补贴可以在其他地方更好地用于帮助处境最不利的人,并连续抛出“基于市场现实,补贴将消耗中产家庭的财政资源”、“资助学前教育并不意味着让所有孩子都上学”等富有说服力的论证。

最终投票结果是,62% 的观众支持正方,30% 的观众支持反方,因为反方的跑票数更少,Natarajan 为人类摘下了辩论界人机大战第二战的桂冠。

虽败犹荣,AI 背后的技术不容小觑

尽管 Project Debater 输了,它的表现依然令人印象深刻。

在圆桌环节,Natarajan 如是评价这一强大的 AI 系统:“她能有效理解信息,能通过从后台数据库中提取研究材料,将这些信息快速整合,并流畅地表达出来,如果将这样的技能与人类技能相结合,将会有效地提升决策力。”

IBM AI 再战人类辩手,输了!复盘全程精彩-黑科技

▲从左到右:IBM Research 的 Project Debater 首席研究员 Noam Slonim,IBM Project Debater,IBM Project Debater 项目经理 Ranit Aharonov,人类辩手 Harish Natarajan

这个搅动辩论界风云的 Project Debater 由 IBM Research 所研制,它是一个具有幽默感、小巧机智和偶尔有强有力的论点的实验性会话 AI 系统,也是第一个可以对复杂话题进行辩论的 AI 系统。

要知道,让机器辩驳人类逻辑绝非一件易事。

和拥有预先定义规则的棋盘游戏截然不同,AI 辩手必须适应人的理性和思考逻辑,并提出人们可以理解和接受的论点。

它除了要具备从海量凌乱的非结构化人类语言数据库中检索并提取所需知识的能力外,还要具备坚持自己论点、快速组织逻辑结构、避开语法错误以及预测和反驳对手论点的能力。

美国时间 2018 年 6 月 18 日,Project Debater 首度亮相,并在和人类的首场大战中告捷。Project Debater 与 2016 年的以色列国家辩论冠军 Noa Ovadia、以色列国际辩论协会主席 Dan Zafrir 分别以太空和医疗辩题进行了辩论。

IBM AI 再战人类辩手,输了!复盘全程精彩-黑科技

▲从左到右:IBM Project Debater,以色列国家辩论冠军 Noa Ovadia,以色列国际辩论协会主席 Dan Zafrir

当时 IBM Research 首席调查员兼 Project Debater 的创造者 Noam Slonim 称,这一 AI 系统的训练早在六年前就开始,直到两年前才有能力参与与人们的辩论。

Project Debater 拥有数以亿计的论文、报告和新闻文章的庞大数据库。通过消化这些数据,Project Debater 可以就特定主题做出逻辑结构良好的演讲,提出清晰明确的论点,并对对手观点进行反驳。

过去六年来,IBM 以色列海法实验室领导的全球 IBM 研究团队研究了数十篇研究论文中记载的许多创新技术,最终赋予了 Project Debater 三种功能,每种功能都在 AI 方面开辟了新的天地:

1、数据驱动的语音编写和交付功能;

2、听力理解能够识别隐藏在人类连续冗长的自然语音中的关键主张,并构建有意义的反驳;

3、系统的模拟人类困境,基于一个独特的知识图谱,提炼出原则性的论点。

最终,当 Project Debater 站上辩论场,它已经是一台拥有渊博知识和超强逻辑的颇为“成熟”的辩论机器。

IBM 研究项目 Debade 首席研究员 Noam Slonim 表示,自去年 6 月以来,他们一直在努力改进系统,Project Debater 的数据来源已经扩充到 2018 年年底的数据。

当然,在和人类交锋时,Project Debater 也露出了一些破绽。

比如8个月前和人类的首场辩论赛中,Project Debater 当时出现些许不是很自然的叙述以及夸张过激的言论。再比如在本场辩论赛中,“进化”过的 AI 系统在驳辩环节困守于固有观点,没有做出新的突破。这些问题都需要研究人员持续研究和改进。

IBM 的星辰大海:“无偏见”的辩论机器

IBM(国际商业机器公司)这位年逾百岁的蓝色巨人,不仅堪称科技界的教父级公司,更是 AI 系统的开山鼻祖。

1962 年,IBM 展示了全球第一个语音识别设备 Shoebox。

1997 年,IBM 的深蓝系统 vs 国际象棋世界冠军卡斯帕罗夫,是世界上最早以机器胜利告终的人机大战,比击败柯洁的 AlphaGo 还早了 19 年。

2001 年,IBM 的沃森系统在在美国老牌智力问答节目《危险边缘(Jeopardy!)》打败了最高奖金得主布拉德·鲁特尔和 74 场连胜记录保持者肯·詹宁斯,赢得 100 万美元奖金。

而 Project Debater 出生的使命,也不只是为了和人类打辩论赛。

根据 IBM 研究人员 Noam Slonim 和 Ranit Aharonov 的说法,辩论只是对该技术的有趣展示方式,而 Project Debater 真正力的量将是其展现无偏见论述的能力。

语言充满了魅力,亦处处是陷阱,当人类被情感和偏见左右,看问题的角度很难做到完全的真实与客观。

IBM 希望做到的,是在充满错漏和片面信息的时代,通过推动 AI 在语言和推理的进步,帮助人们建立充分知情的论点,产生更为公正的结论,并做出更好的决策。

当然,这一目标的实现过程充满荆棘。数据库本身就是个难题,Project Debater 所使用的原始数据来自人类的作品,这些数据仍然会包含作者的情感和偏见。

IBM 研究人员 Noam Slonim 曾透露他们解决偏见问题的做法。他们为 AI 系统设置了一个置信度阈值,如果 AI 对其论述感到自信,它会创建一个更复杂的陈述;如果感觉不那么自信,那么陈述就会相对简单。

结语:AI 踏上新的征程

这场辩论赛,AI 输了,这说明在语言和推理领域,人类依然保有优势,而 AI 还没有真正地准备好。

虽然 AI 尚且并不能完全和人类相提并论,但从 Project Debater 的表现来看,我们正在见证互动性 AI 系统的持续演进。

毫无疑问,在快速地成长中,这一变革性的 AI 系统将以更敏锐的反应速度给出流畅的思辨,并将提出更加贴近公正事实的观点。

正如 IBM 研究主管 Dario Gil 所言,Project Debater 存在的目的不是为了击败人类,而是探究如何通过
信息交换和有效交流实现人机合作,提升决策效率和科学性,真正推动 AI 系统的疆界,更好地理解人类。

AI 和人类,谁输谁赢其实并没有那么重要。AI 背后的技术以及如何帮助人类做出更加明智的决定,这些才是我们应当关注的焦点。