MatchZoo - 深度文本匹配工具


Apache
跨平台
Python

软件简介

MatchZoo 是中科院开源的一个文本匹配工具包。 它着重于让大家更直观地了解深度文本匹配模型的设计、对比和共享。

架构

MatchZoo 有三个主要模块,分别为数据预处理、模型构建 和 训练与评测。它基于 Keras 开发,支持 TensorFlow、CNTK 及
Theano,并能在 CPU 与 GPU 上无缝运行。

基准测试

下面,以 WikiQA
数据集来举例说明 MatchZoo 的用法。

以 DRMM 为例,运行:

python main.py --phase train --model_file models/wikiqa_config/drmm_wikiqa.config

在测试时可运行:

python main.py --phase predict --model_file models/wikiqa_config/drmm_wikiqa.config

十个模型的比较结果如下:

loss 训练曲线图如下:

MAP 性能测试曲线图如下: