MatchZoo 是中科院开源的一个文本匹配工具包。 它着重于让大家更直观地了解深度文本匹配模型的设计、对比和共享。
架构
MatchZoo 有三个主要模块,分别为数据预处理、模型构建 和 训练与评测。它基于 Keras 开发,支持 TensorFlow、CNTK 及 Theano,并能在 CPU 与 GPU 上无缝运行。
下面,以 WikiQA 数据集来举例说明 MatchZoo 的用法。
以 DRMM 为例,运行:
python main.py --phase train --model_file models/wikiqa_config/drmm_wikiqa.config
在测试时可运行:
python main.py --phase predict --model_file models/wikiqa_config/drmm_wikiqa.config
十个模型的比较结果如下:
loss 训练曲线图如下:
MAP 性能测试曲线图如下: