我正在重写MongoDB映射简化作业以改为使用Hadoop(使用mongo- hadoop连接器),但是当我将两个数据集映射到同一集合时,它将覆盖值而不是使用它们
{reduce:“ collectionName”}-如果结果集中和旧集合中存在给定键的文档,则将对两个值执行reduce操作(使用指定的reduce函数),并将结果写入输出集合。 如果提供了finalize函数,则该函数还将在reduce之后运行。
如何使用mongo-hadoop?
对于寻求此功能的任何其他人,即将推出对多种输入的支持。
具有更改的分支位于此处。它做得很好,我们正在生产中使用它。