炼数成金 门户 商业智能 Watson 查看内容

了解Waston所知:Waston策略的细微选择差别

2016-4-22 16:59| 发布者: 炼数成金_小数| 查看: 19735| 评论: 0|原作者: Jon Lenchner

摘要: Waston通过收集信息进行学习,而非神经连接,它使用算法来理解输入信息中的自然语言。这些算法让它对《危险边缘》的题目类别和线索胸有成竹,且能够找到最有可能的正确答案。 Waston通过成千上万的历史性问题对自己 ...

工具 算法 案例 商业智能 ETL

这篇客座文章来自IBM调研员Jon Lenchner博士的三篇连载系列文章的第二篇,文章内容是关于Waston如何参与美国人最喜欢的竞赛游戏®。

Waston通过收集信息进行学习,而非神经连接,它使用算法来理解输入信息中的自然语言。这些算法让它对《危险边缘》的题目类别和线索胸有成竹,且能够找到最有可能的正确答案。 

Waston通过成千上万的历史性问题对自己了解和不了解的知识进行自我评估(这些题目对Waston来说相当于参加了几百次“实践测试”)。
处理自然语言的算法并不完美,因而总会存在一定的不确定性。Waston通过计算不确定性来确定在何种情况下信任哪一种算法,比如《危险边缘》中不同类别的问题。

IBM 调研员David Gondek博士开发了Waston用来评级和评估候选答案可信度的机器学习算法和基础架构,他以 “引入” 和 “制造”这两个词为例,体现语言中同一个意思有多种不同的表达方式和上下文的关系。

“线索是:它由可口可乐公司于1963年引入。Waston能够找到一篇文章描述为:‘可口可乐公司在1963年第一次制造生产Tab饮料(正确答案)’,因此,为了回答这个问题,Waston需要了解引入和制造可以表达同一个意思——如果一个公司引入了一个产品。但是这很大程度上取决于上下文:如果你介绍你的叔叔,那并不等于你制造了他。”

Waston也展现了它在类别内的动态学习。Waston通过观察线索的正确答案来验证自己是否正确解读题目类别。陪练赛为Waston在竞赛中做出调整提供了很好的案例。Waston不仅能够更好地根据类别中提示的线索回答问题,而且它对于自己类别的理解能力也得到改善。

请注意,因为Waston没有听觉,因而它不知道詹宁斯或鲁特是如何回答线索的。因此,Waston不能用他们的回答来评估自己的正确性,也不会改变自己正在思考的答案。

答题的可信度
观看练习赛的过程中,我们可以看到Waston前三个候选答案的可信度图表和一条它必须答题的阀值线。
Waston的默认阈值通常为50%。也就是说,如果Waston预估一个答案的可信度达到了50%或50%以上,他就会答题。

但是答题的阀值取决于比赛情况。
在比赛即将结束之时,阀值会发生实质性变化。例如,如果赢的机率更高,Waston将会降低阀值,从而避免统计锁定。类似地,如果Waston处于领先地位且输的可能性就是答题且回答不正确,那么无论可信度有多高,它都不会答题。

线索选择
如果Waston开始选择一个题目类别和线索,它的第一选择就是找出游戏中三个复试下注的剩余部分。参赛者可以对这些线索下赌注且不需要担心另外两个参赛者的回答。詹尼斯、拉特和Waston能够正确回答的概率都很高,因此复试下注就有可能三次大幅度地提高分值。
Waston研发团队研究了复试下注的历史分布,发现它们更多的出现在下面三行,第四行是最常见的。而且,复试下注的线索也有可能出现在第一栏。Waston根据已有的比赛结果利用统计学来预测复试下注线索的位置。

一旦游戏板上没有复试下注的题目,Waston就会寻找类别内分值较低的线索,从而剩下更多高分值的线索。较低分值的线索有助于在较低风险的情况下得到这个类别的要点,从而在接下来的高分值题目中有更好的表现。

什么是复试下注?
当一个参赛者选择了复试下注,他可以在五美元和他现有分值的范围内下注(正确的复试下注),如果他的现有分值高于这道题的较高分值,那以他的下注值为该线索的分值,如果现有分值低于这道题的较高分值,则采用较高分值作为该线索的分值。(第一轮《危险边缘》的较高分值为1000美元,第二轮为2000美元)。

《危险边缘》的第一轮有一次复试下注;第二轮有两次。

欢迎加入本站公开兴趣群
商业智能与数据分析群
兴趣范围包括各种让数据产生价值的办法,实际应用案例分享与讨论,分析工具,ETL工具,数据仓库,数据挖掘工具,报表系统等全方位知识
QQ群:81035754

鲜花

握手

雷人

路过

鸡蛋

最新评论

热门频道

  • 大数据
  • 商业智能
  • 量化投资
  • 科学探索
  • 创业

即将开课

热门文章

     

    GMT+8, 2018-10-18 04:49 , Processed in 0.126322 second(s), 23 queries .