Pytorch中矩阵乘法使用及案例

2025-03-13 约 627 字预计阅读 2 分钟

torch 中包含许多矩阵乘法，大致可以分为以下几种：

其中， torch.matmul() 中包含 torch.dot() 、 torch.mm() 和 torch.bmm()

a = torch.tensor([2, 3])
b = torch.tensor([2, 1])

## 下面四个函数的结果是一样的  结果都是7
a.dot(b)
torch.dot(a, b)
a @ b
torch.matmul(a, b)

输出结果：

但 torch.matmul() 和 torch.dot() 的主要区别就是，当两个向量（矩阵）的维度不一致时， torch.matmul() 会进行广播，而 torch.dot() 会报错

对向量 a 和 b 进行 按位相乘

a = torch.tensor([2, 3])
b = torch.tensor([2, 1])

a * b  # [4, 3]

用于二维矩阵的相乘——第一个向量的列和第二个向量的行必须相等

mat1 = torch.randn(2, 3)
mat2 = torch.randn(3, 3)

## 下面三个输出结果是一样的
torch.mm(mat1, mat2)
mat1.matmul(mat2)
mat1 @ mat2

输出结果：

但 torch.matmul() 和 torch.mm() 的主要区别就是，当两个矩阵的维度不一致时， torch.matmul() 会进行广播，而 torch.mm() 会报错

应用于三维矩阵，要求：

该函数相当于 分别对每个 batch 进行二维矩阵相乘

bmat1 = torch.randn(2, 1, 4)
bmat2 = torch.randn(2, 4, 2)

## 下面三个输出是一样的
torch.bmm(bmat1, bmat2)
bmat1.matmul(bmat2)
bmat1 @ bmat2

输出结果：

换一种角度想， torch.bmm() 就是相当于按照批次 batch 进行索引，然后将每个批次内的二维矩阵进行相乘

for i in range(bmat1.shape[0]):  # 索引出来批次bmat1.shape[0]
    temp =torch.mm(bmat1[i, :, :], bmat2[i, :, :])
    print(temp)

目录