合山新闻网 - 做最好的新闻网站!

关于我们

合山新闻网-合山新闻

一张图带你看懂IBM Waston的工作原理

时间:2019-05-06 14:23:40    作者:admin    来源:网络整理

  英文原文:Knowledge Representation in the Age of Deep Learning, Watson, and the Semantic Web

  IBM 沃森(Watson)系统来自于打造了现代 IBM 的首席执行官 Thomas Watson Sr,2011 年该系统在美国的电视问答节目 Jeopardy!(危险之旅!)上击败了两名人类冠军选手,从此一战成名。

一张图带你看懂 IBM Waston 的工作原理

  Jeopardy!(危险之旅!)的比赛以一种独特的问答形式进行,问题设置的涵盖面非常广泛,涉及到历史、文学、艺术、流行文化、科技、体育、地理、文字游戏等等各个领域。根据以答案形式提供的各种线索,参赛者必须以问题的形式做出简短正确的回答。与一般问答节目相反,《危险边缘》以答案形式提问、提问形式作答。参赛者需具备历史、文学、政治、科学和通俗文化等知识,还得会解析隐晦含义、反讽与谜语等,而电脑并不擅长进行这类复杂思考。

  需要特别提到的是,在比赛中 Watson 是断开网络(offline)的。与 AlphaGo 同李世石对战中不同,Waston 只能使用保存在硬盘中的知识库基本包与扩展包作为自己的知识储备,和人类参赛选手一样。在这种情况下,沃森在前两轮中与对手打平。而在最后一集里,沃森打败了最高奖金得主布拉德·鲁特尔和连胜纪录保持者肯·詹宁斯,夺得第一名。

  Waston 本质上是 IBM 制造的电脑问答(Q&A)系统, IBM 介绍时说“Waston 是一个集高级自然语言处理、信息检索、知识表示、自动推理、机器学习等开放式问答技术的应用”,并且“基于为假设认知和大规模的证据搜集、分析、评价而开发的 DeepQA 技术”。虽然采用了深度学习中一些技术如迁移学习 (Transfer Learning)来解决一些问题,但与 AlphaGo 不同,它并不是完全采用深度学习技术的人工智能。它的主体思路并非深度学习,而是更接近心智社会(Society of Mind)。

  在刚刚闭幕的 IJCAI2016 会议上,伦斯勒理工学院教授 James Hendler 受邀演讲详细介绍了 IBM Waston 的工作原理。

一张图带你看懂 IBM Waston 的工作原理

一张图带你看懂 IBM Waston 的工作原理

  将沃森设想为一间环形办公室走廊,每一间办公室都有一群人做着特殊的工作,让我们从头来梳理整个运行过程。

  • 问题输入(QUESTION IN)

  • 问题分析 (Question Analysis)

  •   这个问题什么意思?

      我们在找什么?

      还存在其他有效信息么?

      问题中有没有词语提到问题中的其他词语?

      在这一环节,DeepQA 尝试去理解问题,搞清楚问题到底在问什么,同时做一些初步的分析来决定选择哪种方法来应对这个问题。

  • 初步搜索 Primary Search

  •   在数据库中能不能找到或许跟这个问题有关的文件?

      找到了多少文件?

      这些文件从哪里来的?

  • 搜索结果处理并生成备选答案 Search Result Processing and Candidate Answer Generation

  •   在这些文件中,有这个问题可能的答案么?

      有多少个备选答案?

      当问一个问题时,一份文档打开了。文档在办公室中不断移动时,更多信息被添加进去了。

  • 上下文无关回答得分 Context-Independent Answer Scoring

  •   这个选择有可能是正确的答案吗?

      这个选择是正确的答案形式吗?

  • 软滤波 Soft Filtering

  •   有哪些选择是明显错误的?

      如果是的话,能不能让它们在后面的处理过程中不占太多的时间?

      每个可能的回答都被给定一个分数,给出这个证据对备选答案支持得到底有多好。

  • 支持证据检索 Supporting Evidence Retrieval

  •   能在数据库中找到任何能够证明某个选择答案是正确的信息吗?

      对每个选择来说有多少信息在哪?

  • 搜索结果处理和上下文无关得分 Search Result Processing and Context Dependent Scoring

  •   选择工作作为问题回答怎么样?

      现在有更多的信息,能给每个选择什么分数?

  • 最终合并并排名 Final Merging and Ranking

  •   还有任何能够改变分数的额外信息吗?

      每个选择的总分是多少?

      哪个选择分数最高?

      分数第二高的选择是什么?

    相关文章
    
    

    2015-2018 Copyright © 合山新闻网