PyTorch计算余弦相似度距离中dim参数的使用方法详解

前言

一、官方函数用法

二、实验验证

1.计算高维数组中各个像素位置的余弦距离

2.验证高维数组中任意一个像素位置的余弦距离

总结


前言

现在要使用Pytorch中自带的torch.nn.CosineSimilarity函数计算两个高维特征图(B,C,H,W)中各个像素位置的特征相似度,即特征图中的每个像素位置上的一个(B,C,1,1)的向量为该位置的特征,总共有BxHxW个特征。

一、官方函数用法

        意思是 dim参数指定了函数在哪个维度上进行余弦距离计算,计算之后该维度会消失,而其他维度的形状保持不变。但是现有的大多数博客将dim的用法复杂化,因此这里进行简单的实验验证,来验证一下上述说法。

二、实验验证

1.计算高维数组中各个像素位置的余弦距离

创造高维数组,在通道维度(即dim=1)上进行向量的余弦距离计算,并查看其中第一批数据中的位置(0,0)上的两个向量之间的余弦距离:

>>> import torch
>>> import torch.nn as nn

>>> cos = nn.CosineSimilarity(dim=1, eps=1e-6)

>>> input1 = torch.randn(3, 64, 100, 128)
>>> input2 = torch.randn(3, 64, 100, 128)

>>> output = cos(input1, input2)

>>> output[0, 0, 0]
tensor(-0.1095)

2.验证高维数组中任意一个像素位置的余弦距离

将上述高维数组中的第一批数据中的位置(0,0)上的各个通道数值组成该位置上的特征向量,并计算两个向量间的余弦距离:

>>> import torch
>>> import torch.nn as nn

>>> cos2 = nn.CosineSimilarity(dim=0, eps=1e-6)

>>> input3=input1[0, :, 0, 0]
>>> input4=input2[0, :, 0, 0]

>>> output2 = cos2(input3, input4)

>>> output2
tensor(-0.1095)

发现两个距离是相同的,因此dim参数指定了函数在哪个维度上进行余弦距离计算,计算之后该维度会消失,而其他维度的形状保持不变。


总结

  Pytorch中自带的torch.nn.CosineSimilarity函数计算两个高维特征图中各个像素位置的特征相似度,其中dim参数指定了函数在哪个维度上进行余弦距离计算,计算之后该维度会消失,而其他维度的形状保持不变。

物联沃分享整理
物联沃-IOTWORD物联网 » PyTorch计算余弦相似度距离中dim参数的使用方法详解

发表评论