您是否知道一种用于快速过滤字符串列表以获得包含指定字符串的子集的方法?显而易见的实现是仅遍历列表,检查每个字符串是否包含搜索字符串。有没有办法索引字符串列表,以便可以更快地完成搜索?
维基百科文章列出了几种索引子字符串的方法。你有:
后缀树 后缀数组 N-gram索引,文本的所有N-gram的反向文件 压缩后缀数组1 调频指数 LZ指数