炼数成金 门户 商业智能 Watson 查看内容

IBM的研究员告诉我们:Watson是如何判断对错的

2016-3-23 09:39| 发布者: 炼数成金_小数| 查看: 19251| 评论: 0|原作者: DEAN TAKAHASHI

摘要: 对于大多数观众来说,在”Jeopardy”节目上连看三晚超级计算机的答题是一件很令人费解的事情,因为Watson可以在某些问题上给出很棒的答案,而另一些问题却回答的很糟糕。约翰·普拉格(John Prager)是Watson编程工 ...

算法 计算机 编程 超级计算 Watson

IBM researcher explains what Watson gets right and wrong (video)
原文链接:http://venturebeat.com/2011/02/17/ibm-researcher-explains-what-watson-gets-right-and-wrong/ 

Watson超级计算机在电视节目”Jeopardy”中战胜人类选手之后,IBM就一直沐浴在胜利的光辉中。
对于大多数观众来说,在”Jeopardy”节目上连看三晚超级计算机的答题是一件很令人费解的事情,因为Watson可以在某些问题上给出很棒的答案,而另一些问题却回答的很糟糕。约翰·普拉格(John Prager)是Watson编程工作中25位研究者之一,在”Jeopardy”总决赛播出期间、昨晚的IBM活动上也解释Watson是如何工作的。他的解释让我们见识到了人类智慧的本质和机器智能的比较——这也是计算机科学家所知的最古老的技术问题之一了。

普拉格说,如果把深蓝(DeepBlue)——IBM在1997年击败了国际象棋冠军卡斯帕罗夫的超级计算机,和参加”Jeopardy”节目的Watson相比较,那是再好不过的了。普拉格说,国际象棋是“人类智慧的标志性代表”,不过”Jeopardy”却更像是“人类存在意义的标志性代表”。用来玩国际象棋的算法和用于“Jeopardy”的算法之间有很少交叉,那是因为“Jeopardy”代表了一个巨大的“自然语言理解”问题。

对于人类来说,理解语言是很容易的。但是对Watson来说是个艰难的部分。如果在数据库中有个准确的答案,像“爱因斯坦是在哪里出生的?”这样的问题对Watson来说是很容易的。如果没有较精确的匹配,计算机将从各种各样可能存在答案的数据片段中来推断答案。例如,如果数据库中有一个:“杰克·韦尔奇想一个艺术家一样经营美国通用电气公司。”电脑可能会认为韦尔奇是个艺术家,而不是通用电气的前首席执行官。

“Jeopardy”有各种各样类型的题目,为计算机敞开了整个人类的知识让其理解。这也使得人工智能问题变得很困难。与谷歌搜索引擎给出一系列相关答案的结果不同,Watson是需要校正的,而且它还必须提供最优的答案。而在“Jeopardy”比赛中,如果你回答了一个错误的答案,你被扣分。

因为是与快速的人类玩家对阵,Watson也需要有速度。它拥有2,880个IBM Power、750核(或者说是计算机大脑)和15 TB的内存帮助它。IBM的研究人员四年前就已经开始研究了,他们发现自己的电脑回答“Jeopardy”问题的正确性极差。这个编程是用Java和C ++语言的。同时,IBM还创造了一个粉丝网站,挖出了以前“Jeopardy”游戏节目历史上的“Jeopardy”问题和答案。

“我们还有很长的路要走。”普拉格说。
Watson还将面临许多小问题,包括一个“问题分析”制度——当一个问题被提出的时候它会开始工作,这部分就像一个搜索引擎。它先提出上百个有望进一步处理的可能的答案,然后它会运行100至200个算法来寻找答案之间的不同特征。一种机器语言算法会将最重要的解决方案排序出来。然后,它会计算这个排名的置信等级,如果它高于某个阈值就只给出一个排名。

在一个周二晚上,Watson在一个美国城市类的问题中给出了糟糕的答案:多伦多。这是因为Watson在为可能的答案设置边缘条件方面没有倾注过多的精力去分类。确实,美国是有一个命名为多伦多的城市,而且多伦多蓝鸟棒球队还在美国同盟比赛。这些事实可能已经将Watson抛到了一个滑稽的地步。因为Watson会在回答之后做题目标记,这导致了他较低的置信水平,而且它还是在被迫的情况下回答问题的。

在回答奥利奥饼干是什么时候被提出的时候,它还说了“1920”。问题是,几秒前人类选手肯·詹宁斯(Ken Jennings)在回答相同问题时刚被告知“20年”错了。这是因为IBM公司的研究人员为了简化Watson的编程,让计算机对其他玩家的回答“装聋作哑”。而且在许多对阵游戏中,出现之前问过的问题的情况可能性非常低,普拉格说到。
“这是纯粹的运气不好。”普拉格说。

做完主持人亚历克斯·特里贝克(Alex Trebek)昨晚指出,在Watson进行“Jeopardy”总决赛和每日双重赌博的时候取得了随机美元金额的投注。普拉格说,Watson觉得它并不需要为了赢得在周二晚上的比赛而赌掉一切。而按类别进行的统计分析,我们预测它不会在短类别或者某些话题上做得很好。于是它就知道有时是需要少量下注的。做那部分编程的研究人员认为,押宝“零”会很无聊,而押宝随机的数量将会变得有趣。

Watson是不用连接互联网的,但是IBM使用了很多图书馆般的资源并将其塞进Watson的数据库中——这些当然都是提前做好的。当一个程序正在运行时,代码和数据被送入Watson的存储器中,然后处理器读入一个问题并取得较好的答案。大量的数据被复制,大量的数据在节目拍摄的几个星期内被更新。

IBM让Watson与“Jeopardy”节目的前冠军们进行了55场对阵训练。Watson获胜的次数占71%。这是相对于总冠军比赛更科学的结果。普拉格说,观看Watson的经历就像父母看着孩子在学校表演,而且你会担心并希望孩子别在它的台词部分搞砸了。

“训练有素的人可以在问题提出的时候就预测到Watson是否会得到正确的答案,”普拉格说,“Watson纠结的是它们到底想问的是什么,而且会在意语言的清晰度。‘Jeopardy’是一个娱乐节目,而且问题往往在告知或者思考前被处理好。”

另一个IBM研究人员伯恩·刘易斯说,Watson在实际节目中回答问题的时候都得按蜂鸣器。这些问题对于人类玩家来说是可见的,因此“问题出现在人类视网膜上和Watson芯片读取到的时间是相同的。”普拉格说。它可以在六毫秒之内接收到信号,而这个速度比大多数人能做出的反应都快。刘易斯说,如果有哪个人类可以在Watson按蜂鸣器之前出手,或者刚听完问题的最后一个单词就做出回答,那他真是投机了。

Watson一般在各个类别中都有其身影,因为它一直在寻找每日双重赌博,这可以为它提供一个可以获得问题较高分的机会,而且选手寻找这些每日双重赌博也有一定的模式,普拉格说。

IBM认为,Watson的发明可以在类似于自动化客户支持的方面被使用。
IBM已经发起了一个博客贴子,主题是Watson在“Jeopardy”总决赛之中的麻烦。而且在斯蒂芬贝克的新书《“Jeopardy”总决赛:人机大战与探索世界的一切》中,也有关于Watson的大量话题。

欢迎加入本站公开兴趣群
商业智能与数据分析群
兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
QQ群:81035754

鲜花

握手

雷人

路过

鸡蛋

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

热门文章

     

    GMT+8, 2018-12-16 20:27 , Processed in 0.160577 second(s), 23 queries .