余弦相似度,就是计算两个向量间的夹角的余弦值。余弦相似度的取值范围是[-1,1]。
余弦距离就是用1减去这个获得的余弦相似度。 余弦距离的取值范围为[0,2] 。
计算余弦相似度,只需要将vec L2范数归一化后,使用内积度量。
举例子计算余弦相似度:
a=[3,4] //a的模是5
b=[5,12] //b的模是13
方法一:
向量内积/向量的模 = 余弦相似度
(3 * 5 + 4 * 12)/ (5 * 13) = 0.969
方法二:
L2范数归一化=向量的各自分量/向量的模
a=【3/5, 4/5】,b=【5/13, 12/13】
再计算向量的内积
3/5 * 5/13 + 4/5 * 12/13 = 0.969
版权声明:本文为woomay原创文章,遵循 CC 4.0 BY-SA 版权协议,转载请附上原文出处链接和本声明。