如果将归一化后的嵌入向量用于计算余弦相似度或欧几里德距离,并基于这些相似性度量对向量进行排序,得到的排序结果将是相同的。也就是说,无论是使用余弦相似度还是欧几里德距离来衡量向量之间的相似性,排序后的结果将是一致的。这是因为在归一化后,向量的长度不再影响它们之间的相对关系,只有方向信息被保留下来。因此,使用归一化的向量进行相似性度量时,不同的度量方法将得到相同的排序结果。在向量归一化后,将所有向量的长度缩放到 1,这意味着它们都处于单位长度上。单位向量只描述了方向而没有大小,因为它们的长度恒为 1。具体原理可问 ChatGPT.
Embeddings
类型即可。
business@dify.ai