在一个文本文件中,我有150个字。我还有另一个文本文件,大约有100,000行。
如何检查属于第一个文件的每个单词是否在第二个文件中?
我曾考虑过使用grep,但找不到如何使用它来阅读原始文本中的每个单词。
grep
有没有办法做到这一点awk?还是其他解决方案?
awk
我尝试使用此shell脚本,但它几乎匹配每一行:
#!/usr/bin/env sh cat words.txt | while read line; do if grep -F "$FILENAME" text.txt then echo "Se encontró $line" fi done
我发现的另一种方法是:
fgrep -w -o -f "words.txt" "text.txt"
您可以使用grep -f:
grep -f
grep -Ff "first-file" "second-file"
否则匹配完整的单词:
grep -w -Ff "first-file" "second-file"
更新: 根据评论:
awk 'FNR==NR{a[$1]; next} ($1 in a){delete a[$1]; print $1}' file1 file2