两个(词,频率)向量之间的“距离”是它们之间的角度。如果x = ((w1,f1), (w2,f2), ..., (wn,fn))是file_1的第一个向量并且y = ((w1',f'1), (w'2, f'2), ..., (w'm,f'm))是file_2的第二个向量,那么它们之间的角度定义为:d(x,y) = arccos(inner_product(x,y) / (norm(x)*norm(y)))
两个(词,频率)向量之间的“距离”是它们之间的角度。如果x = ((w1,f1), (w2,f2), ..., (wn,fn))是file_1的第一个向量并且y = ((w1',f'1), (w'2, f'2), ..., (w'm,f'm))是file_2的第二个向量,那么它们之间的角度定义为:d(x,y) = arccos(inner_product(x,y) / (norm(x)*norm(y)))
暂无评论