我一直在为投资组合管理工具开发内部网站。有很多文本数据,公司名称等。我对某些搜索引擎能够以“您的意思是:xxxx”快速响应查询的能力印象深刻。
我需要能够智能地进行用户查询并不仅使用原始搜索结果而且还使用“您的意思是?”进行响应。当有非常可能的替代答案时的响应等
[我正在ASP.NET中开发(VB-不要反对我!)]
更新:好的,如果没有成千上万的“未付费用户”,我该如何模仿呢?
这是直接来自来源的解释(差不多)
在22:03分钟
值得一看!
基本上,根据Google前CTO道格拉斯·梅里尔(Douglas Merrill)的说法,它是这样的:
1)您在Google中写了一个(拼写错误的)单词
2)您找不到想要的东西(不要单击任何结果)
3)您意识到自己拼错了单词,因此在搜索框中重写了单词。
4)找到所需的内容(单击第一个链接)
此模式乘以数百万次,显示出最常见的错误拼写和最“常见”的更正。
这样,Google几乎可以即时提供每种语言的拼写校正功能。
这也意味着,如果所有人都在一夜之间开始拼写为“ nigth”,那么google会建议该单词代替。
编辑
@ThomasRutter:道格拉斯将其描述为“统计机器学习”。
他们知道谁更正查询,因为他们知道哪个查询来自哪个用户(使用cookie)
如果用户执行查询,只有10%的用户单击一个结果,而90%的用户返回并键入另一个查询(带有更正的单词),而这次有90%的用户单击一个结果,那么他们知道已经找到了更正。
他们还可以知道这些查询是否是两个不同的“相关”查询,因为它们具有所显示的所有链接的信息。
此外,他们现在将上下文包括在拼写检查中,因此他们甚至可以根据上下文建议不同的单词。
观看此Google Wave演示(@ 44m 06s),该演示显示了如何考虑上下文以自动更正拼写。
在此说明自然语言处理的工作方式。
最后,这是一个很棒的演示,演示如何将自动机器翻译(@ 1h 12m 47s)添加到混合中。
我在视频中添加了分钟和秒的锚点,以直接跳至内容,如果它们不起作用,请尝试重新加载页面或手动滚动到标记。