DrQA - 开放域问答系统


CC-BY-NC
跨平台
Python

软件简介

DrQA 是 Facebook 开源的开放域(Open-Domain)问答系统,通过阅读理解维基百科,来回答用户的各种问题。

DrQA
主要针对的“机器阅读规模”(MRS)的任务。在这种情况下,我们要在可能非常大的非结构化文档语料库(可能并不冗余)中搜索问题的答案。因此,系统必须将文档检索(查找相关文档)与文本的机器理解(识别这些文档的答案)相结合。

DrQA 使用维基百科作为文档的唯一知识来源。为了回答一个问题,系统必须首先检索超过 500
万篇文章中的少数几篇可能相关的文章,然后再仔细地扫描它们以确认答案。

请注意,DrQA 将维基百科视为文章的一般集合,但不依赖于其内部图形结构。因此,DrQA 可以直接应用于任何文件集合。