别再傻傻分不清了！PyTorch中矩阵的⊕、⊙、⊗操作符与*、@、torch.mul()的保姆级对照指南

张开发

• 2026/4/19 21:45:22 • 15 分钟阅读

分享文章

别再傻傻分不清了！PyTorch中矩阵的⊕、⊙、⊗操作符与*、@、torch.mul()的保姆级对照指南

PyTorch矩阵操作符完全指南从数学符号到代码实现刚接触深度学习时最让人头疼的莫过于论文中那些神秘的数学符号和实际代码之间的对应关系。⊕、⊙、⊗这些看似简单的符号在PyTorch中到底该用、*还是为什么有时候*能得到预期结果有时候却会报错本文将彻底解析这些符号在PyTorch中的实现方式帮助你在阅读论文和编写代码时不再困惑。1. 数学符号与PyTorch操作符对照表在深入探讨之前我们先建立一个清晰的对应关系表数学符号数学含义PyTorch操作符等价函数调用广播支持⊕逐元素加法torch.add()是⊙逐元素乘法*torch.mul()是⊗矩阵乘法torch.matmul()部分注意PyTorch中的*操作符执行的是逐元素乘法(⊙)而不是矩阵乘法(⊗)这是新手最常见的误区之一。2. 逐元素操作⊕和⊙的实现2.1 逐元素加法(⊕)逐元素加法要求两个张量形状相同或者满足广播规则。PyTorch提供了多种实现方式import torch # 创建两个相同形状的矩阵 A torch.tensor([[1, 2], [3, 4]]) B torch.tensor([[5, 6], [7, 8]]) # 三种等价实现方式 result1 A B # 使用运算符 result2 torch.add(A, B) # 使用add函数 result3 A.add(B) # 使用张量的add方法当形状不同但满足广播条件时PyTorch会自动扩展较小的张量# 矩阵与标量相加 C torch.tensor([[1, 2], [3, 4]]) scalar 10 print(C scalar) # 输出: tensor([[11, 12], [13, 14]]) # 矩阵与向量相加 D torch.tensor([[1, 2], [3, 4]]) vector torch.tensor([10, 20]) print(D vector) # 输出: tensor([[11, 22], [13, 24]])2.2 逐元素乘法(⊙)与加法类似逐元素乘法也有多种实现方式# 三种等价实现方式 result1 A * B # 使用*运算符 result2 torch.mul(A, B) # 使用mul函数 result3 A.mul(B) # 使用张量的mul方法广播机制同样适用# 矩阵与标量相乘 print(A * 2) # 输出: tensor([[2, 4], [6, 8]]) # 矩阵与向量相乘 vector torch.tensor([2, 3]) print(A * vector) # 输出: tensor([[2, 6], [6, 12]])3. 矩阵乘法(⊗)的多种实现矩阵乘法是线性代数中的核心操作PyTorch提供了丰富的实现方式3.1 基本矩阵乘法# 创建两个矩阵 E torch.tensor([[1, 2], [3, 4]]) F torch.tensor([[5, 6], [7, 8]]) # 四种等价实现方式 result1 E F # 使用运算符(Python 3.5) result2 torch.matmul(E, F) result3 torch.mm(E, F) # 专门用于2D矩阵 result4 E.mm(F) # 张量方法版本重要区别torch.mm()仅支持2D矩阵而torch.matmul()支持更高维度的张量并实现了广播。3.2 高维张量的矩阵乘法当处理批量矩阵乘法时如在神经网络中处理一批输入matmul会自动应用广播# 批量矩阵乘法示例 batch1 torch.randn(10, 3, 4) # 10个3x4矩阵 batch2 torch.randn(10, 4, 5) # 10个4x5矩阵 result torch.matmul(batch1, batch2) # 结果为10个3x5矩阵3.3 向量与矩阵的乘法PyTorch会自动处理向量和矩阵的乘法无需显式转置matrix torch.tensor([[1, 2], [3, 4]]) vector torch.tensor([5, 6]) # 矩阵乘以向量 print(matrix vector) # 输出: tensor([17, 39]) # 向量乘以矩阵 print(vector matrix) # 输出: tensor([23, 34])4. 广播机制详解广播是PyTorch中强大的特性它允许不同形状的张量进行运算。理解广播规则对正确使用⊕、⊙操作至关重要。4.1 广播规则从最后一个维度开始向前比较维度大小相等或其中一个为1时可以进行广播缺失的维度被视为1# 广播示例1 A torch.ones(3, 1, 4) B torch.ones(2, 1) print((A B).shape) # 输出: torch.Size([3, 2, 4]) # 广播示例2 C torch.ones(5, 3, 4, 1) D torch.ones(3, 1, 2) print((C * D).shape) # 输出: torch.Size([5, 3, 4, 2])4.2 常见广播错误# 不兼容的形状 try: A torch.ones(3, 4) B torch.ones(2, 4) print(A B) except RuntimeError as e: print(f错误: {e}) # 输出: 错误: The size of tensor a (3) must match...5. 实际应用场景与性能考量5.1 计算机视觉中的典型应用在计算机视觉中这些操作符无处不在# 特征图相加(⊕) feature_map1 torch.randn(1, 64, 256, 256) feature_map2 torch.randn(1, 64, 256, 256) combined_features feature_map1 feature_map2 # 注意力权重应用(⊙) attention_weights torch.rand(1, 1, 256, 256) weighted_features feature_map1 * attention_weights # 全连接层计算(⊗) weight_matrix torch.randn(512, 1024) input_features torch.randn(32, 1024) # 批量大小32 output input_features weight_matrix.T5.2 性能优化技巧对于大型矩阵乘法使用torch.matmul而不是多个torch.mm就地操作可以节省内存A.add_(B) # 就地加法比A A B更高效使用torch.einsum表达复杂张量操作# 使用einsum实现批量矩阵乘法 result torch.einsum(bij,bjk-bik, batch1, batch2)6. 常见陷阱与调试技巧6.1 形状不匹配问题# 错误的矩阵乘法 A torch.randn(3, 4) B torch.randn(5, 6) try: C A B except RuntimeError as e: print(f矩阵乘法错误: {e})6.2 自动广播导致的意外结果# 意外的广播行为 A torch.tensor([[1, 2, 3]]) B torch.tensor([[1], [2], [3]]) print(A * B) # 输出3x3矩阵而不是预期的错误6.3 类型不匹配问题# 类型不匹配 A torch.tensor([1, 2, 3], dtypetorch.float32) B torch.tensor([1, 2, 3], dtypetorch.int64) try: print(A B) except RuntimeError as e: print(f类型错误: {e})调试技巧使用.shape检查张量形状使用.dtype检查数据类型对于复杂表达式分步计算并检查中间结果7. 进阶话题自定义操作符行为PyTorch允许通过重载魔术方法来定义自定义张量操作class CustomTensor(torch.Tensor): staticmethod def __add__(self, other): print(自定义加法操作) return super().__add__(other) staticmethod def __matmul__(self, other): print(自定义矩阵乘法) return super().__matmul__(other) A CustomTensor([1, 2, 3]) B CustomTensor([4, 5, 6]) _ A B # 会打印自定义加法操作 _ A B # 会打印自定义矩阵乘法

更多文章

前端开发 2026/4/19 21:38:36

BGP选路深度解析：当Next Hop遇上IGP开销，如何避免网络中的“不对称路由”？

BGP选路深度解析：当Next Hop遇上IGP开销，如何避免网络中的“不对称路由”？ 在复杂的多自治系统（AS）网络环境中，BGP路由选择往往被视为网络工程师手中的瑞士军刀。但鲜为人知的是，这把"军刀…

中标麒麟系统试用机制解析与深度维护指南当你在深夜赶项目时，屏幕右下角突然弹出的试用到期提示框是否让你抓狂？这背后其实隐藏着国产操作系统独特的商业模式和技术架构。作为国内最早实现商用的Linux发行版之一，中标麒麟的试用提示机制恰似…

张开发

前端开发 2026/4/19 21:22:27

AGI生成代码的可靠性陷阱：3大未公开的生产环境崩塌案例与7步验证框架

第一章：AGI生成代码的可靠性陷阱：3大未公开的生产环境崩塌案例与7步验证框架 2026奇点智能技术大会(https://ml-summit.org) AGI驱动的代码生成工具正以惊人速度渗透至CI/CD流水线核心，但其“黑盒式正确性”在真实负载下频繁失效。我们复现并…

张开发

别再傻傻分不清了！PyTorch中矩阵的⊕、⊙、⊗操作符与*、@、torch.mul()的保姆级对照指南

最新文章

从Actor模型到实战：Skynet轻量级游戏服务器框架的设计哲学与核心机制

怎么部署OpenClaw？2026年华为云部署OpenClaw配置Coding Plan喂奶级流程

【AGI合规生死线】：2026奇点大会划定的4个法律红线，超期未整改将触发自动审计

视觉幻觉正在瓦解AGI可信边界：3个真实事故复盘+空间推理置信度量化协议（IEEE P2851草案核心条款）

人形机器人半马：进步与失控并存，短板暴露促进行业迭代

知识图谱化技术实体链接与知识推理的实现

推荐文章

嵌入式工程师避坑指南：RK817 PMU在无电池场景下的5个关键配置点

保姆级教程：在S32K312上配置EMIOS0生成PWM信号（附完整代码）

SQL嵌套查询导致内存溢出_改写为连接查询的方法

生化4重制版0xc000007b错误快速修复 2026通用指南

保姆级教程：用Python+Dlib+OpenCV搭建一个实时人脸识别系统（附完整代码）

CSS Sprites：从性能优化到现代前端实践的全景解析

相关文章

高效掌握多步提示工程：进阶AI任务处理的系统方法论

浏览器资源嗅探终极指南：如何轻松下载网页视频与音频

OPEN实战：基于深度强化学习的多无人机追逃在线规划，如何跨越仿真到现实的鸿沟？

从Depth Anything到Video版本：揭秘字节跳动如何用时空注意力突破视频深度估计瓶颈

终极指南：如何使用ChampR构建高性能英雄联盟游戏助手

GLM-4.1V-9B-Base效果展示：中文手绘草图→功能描述→技术实现建议生成

分享文章

更多文章

BGP选路深度解析：当Next Hop遇上IGP开销，如何避免网络中的“不对称路由”？

494.目标和

BilibiliDown：三步完成B站视频批量下载的完整方案

npm ERR! ERESOLVE unable to resolve dependency tree(2026年实操解决经验总结，全程避坑）

【AGI情感交互终极指南】：20年AI专家首曝3大社交能力跃迁路径与5个已商用情感引擎架构

从希腊爱琴海到南海：手把手教你用FDTD和射线追踪法搭建海上无线信道模型

CMake找不到Vulkan库？手把手教你配置Vulkan_SDK环境变量（附ncnn编译实战）

【技术干货】OpenAI Codex 重大更新：从代码补全工具到全流程智能开发平台

告别固定类别！用GLIP模型实现‘指哪打哪’的零样本目标检测（附PyTorch实战代码）

别再只会用WinDbg了！试试微软官方的Application Verifier，内存泄漏和双重释放一抓一个准

不只是关弹窗：从中标麒麟试用提示聊聊国产Linux系统的授权与日常维护

AGI生成代码的可靠性陷阱：3大未公开的生产环境崩塌案例与7步验证框架