用Python和NumPy手把手实现SVD图片压缩：从原理到实战，5分钟搞定你的第一张压缩图

张开发

• 2026/4/13 5:00:17 • 15 分钟阅读

分享文章

用Python和NumPy手把手实现SVD图片压缩从原理到实战5分钟搞定你的第一张压缩图当你第一次听说奇异值分解这个名词时脑海中是不是立刻浮现出一堆复杂的数学公式别担心今天我们要用最直观的方式——图片压缩带你领略SVD的神奇魅力。想象一下只需几行Python代码就能让一张几MB的照片瘦身到原来的几分之一而肉眼几乎看不出差别。这就是SVD在图像处理中的魔法。1. 准备工作搭建你的Python环境在开始之前确保你的电脑上已经安装了以下Python库pip install numpy pillow matplotlib这些库将帮助我们完成整个图片压缩流程NumPy处理矩阵运算的核心工具PillowPILPython图像处理的标准库Matplotlib用于显示和对比压缩前后的图片效果提示如果你使用Anaconda这些库通常已经预装好了。让我们先创建一个新的Python文件比如svd_image_compression.py然后导入必要的库import numpy as np from PIL import Image import matplotlib.pyplot as plt2. 理解SVD的核心思想奇异值分解SVD的本质是将任何矩阵A分解为三个特殊矩阵的乘积A U × Σ × V^T其中U左奇异向量矩阵包含图像的行空间信息Σ对角矩阵对角线上的奇异值按从大到小排列V^T右奇异向量矩阵的转置包含图像的列空间信息为什么这能用于图片压缩因为图像数据中大部分能量都集中在前面几个大的奇异值上。通过只保留前k个最大的奇异值我们可以用更少的数据近似表示原始图像。3. 加载并预处理图片让我们从加载一张图片开始。你可以使用任何你喜欢的图片这里我们以一张常见的测试图片为例def load_image(image_path): 加载图片并转换为NumPy数组 img Image.open(image_path) img_array np.array(img) return img_array # 加载图片 original_img load_image(test_image.jpg) print(f图片形状: {original_img.shape}) # 输出类似 (height, width, 3)彩色图片通常有三个通道红、绿、蓝每个通道都是一个二维矩阵。为了处理方便我们需要将这三个通道分开# 分离RGB通道 red_channel original_img[:, :, 0] green_channel original_img[:, :, 1] blue_channel original_img[:, :, 2]4. 实现SVD压缩函数现在让我们编写核心的压缩函数。这个函数将对单个颜色通道进行SVD分解并根据指定的压缩比例保留相应数量的奇异值def compress_channel(channel, k): 压缩单个颜色通道 U, s, VT np.linalg.svd(channel, full_matricesFalse) # 只保留前k个奇异值 compressed_U U[:, :k] compressed_S np.diag(s[:k]) compressed_VT VT[:k, :] # 重建压缩后的通道 compressed_channel compressed_U compressed_S compressed_VT # 确保像素值在0-255范围内 compressed_channel np.clip(compressed_channel, 0, 255) return compressed_channel.astype(uint8)5. 完整图片压缩流程现在我们可以将各个部分组合起来实现完整的图片压缩流程def compress_image(image_path, k_percentage0.5): 压缩图片并显示结果 # 加载原始图片 original_img load_image(image_path) # 分离通道 red original_img[:, :, 0] green original_img[:, :, 1] blue original_img[:, :, 2] # 确定保留的奇异值数量 k int(min(red.shape) * k_percentage) print(f保留前{k}个奇异值 (压缩比例: {k_percentage*100:.0f}%)) # 压缩各通道 compressed_red compress_channel(red, k) compressed_green compress_channel(green, k) compressed_blue compress_channel(blue, k) # 合并通道 compressed_img np.stack([compressed_red, compressed_green, compressed_blue], axis2) # 计算压缩率 original_size original_img.nbytes compressed_size (U[:, :k].nbytes s[:k].nbytes VT[:k, :].nbytes) * 3 # 三个通道 compression_ratio compressed_size / original_size # 显示结果 plt.figure(figsize(10, 5)) plt.subplot(1, 2, 1) plt.title(Original Image) plt.imshow(original_img) plt.axis(off) plt.subplot(1, 2, 2) plt.title(fCompressed (Ratio: {compression_ratio:.2f})) plt.imshow(compressed_img) plt.axis(off) plt.show() return compressed_img6. 不同压缩比例的效果对比让我们尝试不同的压缩比例看看效果如何# 测试不同压缩比例 for ratio in [0.9, 0.7, 0.5, 0.3, 0.1]: _ compress_image(test_image.jpg, ratio)你会发现一个有趣的现象即使只保留30%的奇异值图片质量仍然相当不错。这是因为能量集中前几个大的奇异值包含了图像的大部分信息视觉冗余人眼对高频细节的敏感度较低颜色通道相关性三个颜色通道之间存在一定的相关性7. 高级技巧与优化7.1 自动确定最优k值我们可以根据奇异值的累积能量自动确定保留多少奇异值def auto_determine_k(s, energy_threshold0.9): 自动确定保留的奇异值数量 total_energy np.sum(s) cumulative_energy np.cumsum(s) / total_energy k np.argmax(cumulative_energy energy_threshold) 1 return k7.2 批量处理图片文件夹如果你有一批图片需要压缩可以这样处理import os def batch_compress(input_folder, output_folder, k_percentage0.5): 批量压缩文件夹中的所有图片 os.makedirs(output_folder, exist_okTrue) for filename in os.listdir(input_folder): if filename.lower().endswith((.jpg, .jpeg, .png)): try: img_path os.path.join(input_folder, filename) compressed_img compress_image(img_path, k_percentage) # 保存压缩后的图片 output_path os.path.join(output_folder, fcompressed_{filename}) Image.fromarray(compressed_img).save(output_path) except Exception as e: print(f处理 {filename} 时出错: {e})7.3 存储优化实际存储时我们可以进一步优化def save_compressed_components(U, s, VT, output_path): 存储SVD分解后的组件 np.savez_compressed( output_path, UU, ss, VTVT ) def load_compressed_components(input_path): 加载SVD组件并重建图片 data np.load(input_path) return data[U], data[s], data[VT]8. 实际应用中的注意事项图片格式选择JPEG适合自然场景照片有损压缩PNG适合线条图、文字无损压缩WebP现代格式更好的压缩率性能考量大图片可以先缩小尺寸再处理对于实时应用考虑使用近似算法质量评估指标PSNR峰值信噪比SSIM结构相似性主观视觉评估def calculate_psnr(original, compressed): 计算PSNR值 mse np.mean((original - compressed) ** 2) if mse 0: return float(inf) max_pixel 255.0 psnr 20 * np.log10(max_pixel / np.sqrt(mse)) return psnr9. 超越基础SVD在其他领域的应用虽然我们聚焦于图片压缩但SVD的应用远不止于此推荐系统用户-物品评分矩阵分解发现潜在特征自然语言处理潜在语义分析LSA文档主题建模信号处理噪声去除特征提取计算机视觉人脸识别特征脸方法背景建模10. 进一步学习的资源如果你想深入了解SVD及其应用可以参考经典教材《线性代数及其应用》by Gilbert Strang《矩阵计算》by Gene H. Golub在线课程MIT OpenCourseWare 线性代数课程Coursera上的机器学习专项课程实用工具库SciPy的稀疏矩阵SVDTensorFlow/PyTorch中的SVD实现在实际项目中我发现最有效的学习方式是将理论知识与实践相结合。尝试用不同的图片、不同的压缩比例进行实验观察效果变化你会对SVD有更直观的理解。

更多文章

前端开发 2026/4/13 4:53:38

为什么你的vLLM吞吐量比竞品低37%？，深度拆解基准测试套件中被忽略的3层时序对齐机制（含CUDA Graph级采样代码）

第一章：大模型工程化性能基准测试套件的范式演进 2026奇点智能技术大会(https://ml-summit.org) 大模型工程化已从单点推理验证迈入全栈协同优化阶段，性能基准测试套件不再仅关注吞吐量与延迟，而是系统性覆盖模型编译、显存调度、分布式通信…

第一章：MoE架构：大模型演进的奇点分水岭 2026奇点智能技术大会(https://ml-summit.org) 混合专家（Mixture of Experts, MoE）并非新概念，但其在大语言模型中的规模化落地，标志着参数增长范式从“全参激活”…

张开发

前端开发 2026/4/13 4:14:11

MATLAB代码：基于主从博弈的电热综合能源系统DE算法优化程序

MATLAB代码：基于主从博弈的电热综合能源系统动态定价与能量管理关键词：主从博弈电热综合能源动态定价能量管理仿真平台：MATLAB 平台优势：代码具有一定的深度和创新性，注释清晰，非烂大街的代码&…

张开发

用Python和NumPy手把手实现SVD图片压缩：从原理到实战，5分钟搞定你的第一张压缩图

最新文章

MedGemma 1.5在嵌入式医疗设备上的优化部署

大模型微调不再难：Llama Factory可视化平台快速入门指南

万象熔炉·丹青幻境效果实测：对比ComfyUI工作流的生成效率与质量

Phi-4-mini-reasoning 3.8B 基础部署教程：Python环境快速配置指南

EagleEye实战案例：野生动物保护区红外相机图像自动物种识别与计数

智能家居中枢：Qwen3-ASR-0.6B在HomeAssistant中的应用

推荐文章

⑩【从0制作自己的ros导航小车：上位机篇】05、导航！

从NUSTCTF Ezjava1看Java Web参数绑定与条件竞争漏洞挖掘

SITS2026现场直击：LLM-native NLP架构设计原则（含可复用的5层抽象模型图谱）

AHT20温湿度传感器库深度解析与工业级应用实践

Rust的引用计数智能指针Rc与Arc在线程共享中的内部可变性

libhv实战：从零构建一个功能完备的HTTP客户端

相关文章

高效掌握多步提示工程：进阶AI任务处理的系统方法论

浏览器资源嗅探终极指南：如何轻松下载网页视频与音频

OPEN实战：基于深度强化学习的多无人机追逃在线规划，如何跨越仿真到现实的鸿沟？

从Depth Anything到Video版本：揭秘字节跳动如何用时空注意力突破视频深度估计瓶颈

终极指南：如何使用ChampR构建高性能英雄联盟游戏助手

GLM-4.1V-9B-Base效果展示：中文手绘草图→功能描述→技术实现建议生成

分享文章

更多文章

为什么你的vLLM吞吐量比竞品低37%？，深度拆解基准测试套件中被忽略的3层时序对齐机制（含CUDA Graph级采样代码）

从实验室到仓库：NeuPAN实战指南——在ROS 2 Humble上为你的移动机器人部署高精度避障

GTE-Pro在政务知识库落地案例：本地化部署+意图识别双合规实践

MySQL InnoDB表空间碎片严重怎么办_使用OPTIMIZE TABLE整理

手把手教你用Python玩转CALCE锂电池数据集：从数据清洗到LSTM/Transformer模型实战

CH32 沁恒标准库实战指南：从GPIO到PWM的快速开发

房价预测不止于线性回归：用XGBoost和LightGBM在Kaggle上提升模型表现的实战对比

生成的actor 依次执行命令

完整指南：5分钟掌握Dell G15开源散热控制神器tcc-g15

关于在VMware虚拟机中安装openEuler系统和opengauss数据库部分问题的解决。

现在不掌握MoE，半年后将无法参与主流大模型迭代——2026奇点大会技术白皮书核心结论首发

MATLAB代码：基于主从博弈的电热综合能源系统DE算法优化程序