我在计算集合(位向量)的Jaccard距离时遇到这个问题:
p1 = 10111;
p2 = 10011。
交集大小= 3;(我们如何找到答案?)
联合的大小= 4,(我们如何找到它?)
Jaccard相似度=(交叉点/联合)= 3/4。
提卡距离= 1 –(提卡相似度)=(1-3 / 4)= 1/4。
但是我不明白我们怎么能找到两个向量的 “交集” 和 “联合” 。
请帮我。
非常感谢。
的设置位数 p1&p2 = 10011
p1&p2 = 10011
的设置位数 p1|p2 = 10111
p1|p2 = 10111
这里的向量表示二进制数组,其中第i位表示该集合中存在第i个元素。