[内核内存] [arm64] 内存回收机制深度解析---从shrink_node到页面回收实战

张开发

• 2026/4/14 19:33:14 • 15 分钟阅读

分享文章

[内核内存] [arm64] 内存回收机制深度解析---从shrink_node到页面回收实战

1. ARM64内存回收机制全景解读当你的手机开始卡顿或者服务器突然响应变慢时背后很可能正在上演一场惊心动魄的内存保卫战。在ARM64架构的Linux系统中内存回收机制就像一位精明的仓库管理员它需要在有限的空间里不断整理、淘汰旧物资确保新货物有地方存放。今天我们就来揭开这个机制的神秘面纱从最核心的shrink_node函数出发直击页面回收的每一个技术细节。内存回收机制本质上是在处理三个关键矛盾内存供需平衡、回收效率和系统性能影响。当系统检测到内存不足时会触发两种回收方式一种是后台的kswapd守护进程进行的异步回收另一种是当进程分配内存时直接触发的同步回收。ARM64架构下的实现有几个显著特点采用NUMA-aware的设计每个内存节点独立管理回收针对大页HugePage做了特殊优化处理利用硬件特性加速页面访问状态检测交换空间管理考虑了移动设备特性在内存压力较大时系统会按照最近最少使用原则通过扫描LRU链表来识别可回收页面。整个过程就像整理衣柜把最近常穿的衣服放在顺手位置不常穿的收起来完全用不到的考虑捐赠释放。2. shrink_node函数深度剖析2.1 函数执行流程解析shrink_node是内存回收的核心引擎它的工作方式就像一位高效的仓库管理员static bool shrink_node(pg_data_t *pgdat, struct scan_control *sc) { do { // 外层循环对整个节点进行扫描回收 memcg mem_cgroup_iter(root, NULL, reclaim); do { // 内层循环处理每个memcg子系统 shrink_node_memcg(pgdat, memcg, sc, lru_pages); shrink_slab(sc-gfp_mask, pgdat-node_id, memcg, sc-nr_scanned - scanned, lru_pages); } while ((memcg mem_cgroup_iter(root, memcg, reclaim))); if (global_reclaim(sc)) shrink_slab(...); } while (should_continue_reclaim(pgdat, ...)); }这个双重循环结构体现了Linux内存管理的层次化设计理念。外层循环确保对整个内存节点完成完整的回收操作内层循环则精细处理每个内存控制组memcg。这种设计带来了三个优势资源分配更公平防止单个memcg占用过多回收资源优先级处理更灵活可以根据memcg的重要性调整回收顺序统计信息更准确每个memcg的回收效果可以独立评估2.2 关键决策逻辑should_continue_reclaim函数是回收过程的大脑它决定了何时停止回收操作。其判断逻辑主要考虑已回收页数如果已经回收了足够多的页面sc-nr_reclaimed (2 sc-order)可以考虑停止可回收页存量当非活跃LRU链表中的页面太少时停止内存规整机会检查是否可以通过内存规整compaction来满足需求实际开发中我们经常遇到的一个问题是如何判断回收是否充分可以通过以下指标评估/proc/vmstat中的pgscan_kswapd_*和pgsteal_kswapd_*计数器/proc/meminfo中的Active(file)和Inactive(file)比值dmesg中是否有kswapd0的活跃日志3. shrink_node_memcg实现细节3.1 扫描策略制定get_scan_count函数就像一位精算师它计算每个LRU链表应该扫描多少页面。其决策矩阵如下条件扫描策略无交换空间仅扫描文件页swappiness0仅扫描文件页内存极度紧张均衡扫描匿名/文件页文件缓存充足优先扫描文件页这个策略在ARM64设备上尤为重要因为移动设备通常交换空间有限zRAM压缩比是关键文件缓存对用户体验影响大电池续航需要考虑回收能耗3.2 页面分类处理shrink_list函数是真正的执行者它根据页面类型采取不同策略static unsigned long shrink_list(enum lru_list lru,...) { if (is_active_lru(lru)) { if (inactive_list_is_low(...)) shrink_active_list(...); } else { return shrink_inactive_list(...); } }活跃链表处理就像整理常用物品检查对应的非活跃链表是否库存不足将部分活跃页面降级到非活跃链表保留最近访问的可执行文件缓存非活跃链表处理则像清理废旧物资解除页面映射unmap回写脏页writeback最终释放到伙伴系统4. 页面回收核心流程4.1 匿名页回收全流程匿名页回收就像处理私人日记——需要特殊照顾交换空间分配通过add_to_swap为没有备份位置的页面分配交换槽位解除映射使用try_to_unmap清除所有PTE映射数据回写将页面内容写入交换分区可能到zRAM缓存清理从swap cache中移除最终释放页面回到伙伴系统在ARM64平台上这个过程有几个优化点利用CONT页表特性批量处理映射针对大页HugeTLB的特殊处理与CPU缓存刷新指令协同工作4.2 文件页回收机制文件页回收相对简单就像处理复印件引用检查通过page_check_references评估页面价值缓存清理从page cache中移除数据回写仅对脏页执行且策略更保守立即释放因为数据有磁盘备份实际性能优化中我们经常调整/proc/sys/vm/vfs_cache_pressure默认100/proc/sys/vm/dirty_writeback_centisecs默认500文件系统的mount参数如noatime5. 高级优化技巧5.1 LRU链表平衡策略inactive_list_is_low函数维护着LRU链表的动态平衡其核心算法是inactive_ratio sqrt(内存大小(GB) * 10) 理想不活跃页数总页数 / (inactive_ratio 1)这个设计确保了小内存设备保持较高的活跃页比例大内存服务器允许更多页面处于非活跃状态比例随内存大小非线性变化5.2 直接回收优化当进程触发直接回收时系统会采取更积极的策略扫描量增加scan_adjused标志会让回收更多页面优先级提升减少睡眠时间加快回收速度提前唤醒kswapd协同工作提高效率在Android系统中这个机制经常与lowmemorykiller协同工作形成完整的内存应急方案。6. 实战问题排查6.1 常见性能问题回收风暴表现为kswapd持续高CPU检查/proc/vmstat中的pgscan_kswapd_*激增解决方案调整swappiness或增加内存过早OOM回收未能释放足够内存检查shrink_page_list的回收效率解决方案优化应用内存使用模式IO瓶颈回收导致设备IO饱和观察vmstat中的io指标解决方案调整dirty_ratio或使用更快存储6.2 调试技巧动态追踪perf probe --add shrink_node perf stat -e probe:shrink_node -a关键指标监控watch -n 1 cat /proc/vmstat | grep -E pgsteal|pgscan页面状态检查tools/vm/page-types -l -N在ARM64服务器环境中还需要特别注意NUMA平衡问题可以使用numastat工具监控跨节点访问情况。理解内存回收机制对性能调优至关重要。就像一位经验丰富的系统管理员告诉我的当遇到内存问题时不要急着加内存先看看回收机制是否在高效工作。通过深入理解shrink_node到页面回收的完整流程我们能够更精准地诊断内存问题制定有效的优化策略。

更多文章

前端开发 2026/4/14 19:33:02

专业数据恢复：如何轻松解密微信聊天记录的终极方案

专业数据恢复：如何轻松解密微信聊天记录的终极方案【免费下载链接】WechatDecrypt 微信消息解密工具项目地址: https://gitcode.com/gh_mirrors/we/WechatDecrypt 你是否曾因更换手机而丢失珍贵的微信聊天记录？或者需要找回重要的商务对话却无从…

张开发

前端开发 2026/4/14 19:32:31

day2项目打卡与leetcode一题

我意识到打卡不用写的这么详细，知道自己做什么了就行。项目部分今天做了什么：①借助AI的力量了解了整体架构，对于初学者来说看懂就更容易了，使用AI赋能。②整理了项目的模块清单，了解了后端的总的分层结构，…

张开发

前端开发 2026/4/14 19:29:47

Cyber Engine Tweaks：3步解锁《赛博朋克2077》终极游戏体验

Cyber Engine Tweaks：3步解锁《赛博朋克2077》终极游戏体验【免费下载链接】CyberEngineTweaks Cyberpunk 2077 tweaks, hacks and scripting framework 项目地址: https://gitcode.com/gh_mirrors/cy/CyberEngineTweaks 你是否渴望在《赛博朋克2077》中获得…

张开发

前端开发 2026/4/14 19:29:41

WebRTC客户端开发避坑指南：手把手解决Ubuntu下摄像头采集、SDL2渲染与ZLMediakit信令对接

WebRTC客户端开发避坑指南：Ubuntu下摄像头采集、SDL2渲染与ZLMediakit信令对接实战在Ubuntu环境下进行WebRTC客户端开发时，开发者常会遇到各种"坑"——从摄像头采集初始化失败到SDL2渲染花屏，再到与ZLMediakit信令对接时的各种异常…

张开发

前端开发 2026/4/14 19:24:44

9.4 推送通知

推送通知是 App 召回用户、传递信息的重要手段。Flutter 中推送通知分为本地通知和远程推送两种，通常结合使用。一、本地通知（flutter_local_notifications） dependencies:flutter_local_notifications: ^17.2.11.1 初始化 import package:fl…

张开发

前端开发 2026/4/14 19:22:49

IMU与GPS数据融合定位：基于位姿状态方程的EKF算法从MATLAB到C++的代码实现解析

IMU和GPS ekf融合定位从matlab到c代码实现基于位姿状态方程，松耦合文档原创且详细这段代码是一个数据融合程序，主要用于将GPS和IMU（惯性测量单元）数据进行融合，以估计车辆的位置和姿态。下面我将对代码进行详细的…

张开发

前端开发 2026/4/14 19:22:19

医疗设备EMC整改时，Y电容怎么选才能不超标漏电流？一个案例讲清楚

医疗设备EMC整改中Y电容选型的漏电流控制实战解析在医疗电子设备研发过程中，电磁兼容(EMC)整改与安规漏电流的平衡一直是工程师面临的棘手问题。当设备传导发射或辐射发射超标时，常见的解决方案是在电源端口增加Y电容来改善滤波效果，但这往往…

张开发

前端开发 2026/4/14 19:21:18

Colab新手入门：从零开始的高效云端开发指南

1. 初识Google Colab：你的云端开发利器第一次听说Google Colab时，我也和大多数新手一样充满疑问：这到底是什么？简单来说，Colab是谷歌提供的免费云端Python开发环境，就像一台随时可用的远程电脑&#xff0…

张开发

前端开发 2026/4/14 19:20:04

别再改 Header 了：高价值窗口里，先暴露的是协议和环境不一致

很多排障动作，一开始就走偏了。一到高价值窗口出问题，团队最常见的动作就是改 Header、补 Cookie、换代理、重放请求。短期看，这些动作有时能拉回一点结果；长期看，很多人只是把真正的问题继续往后拖。因为问题常常不在…

张开发

前端开发 2026/4/14 19:17:32

深入解析BioBERT：高效生物医学文本挖掘的实战应用完全指南

深入解析BioBERT：高效生物医学文本挖掘的实战应用完全指南【免费下载链接】biobert Bioinformatics2020: BioBERT: a pre-trained biomedical language representation model for biomedical text mining 项目地址: https://gitcode.com/gh_mirrors/bi/biobert …

张开发

$如何高效使用BUAAthesis：北航毕业论文LaTeX模板的完整指南$

前端开发 2026/4/14 19:17:26

如何高效使用BUAAthesis：北航毕业论文LaTeX模板的完整指南

如何高效使用BUAAthesis：北航毕业论文LaTeX模板的完整指南【免费下载链接】BUAAthesis 北航毕设论文LaTeX模板项目地址: https://gitcode.com/gh_mirrors/bu/BUAAthesis 对于每一位北航学子来说，毕业论文不仅是学术研究的结晶，更是一…

张开发

前端开发 2026/4/14 19:14:25

软件可靠性测试报告到底该怎么写

关乎用户体验以及企业声誉的，此乃软件产品的可靠性，而一份坚实的关于产品经历测试的报告，它是能够证实产品质量的最为有力的凭证。在最近这段时间里，于行业范围之内接连发生了好几起引人深入思考的事件：在一次针对软件…

张开发

[内核内存] [arm64] 内存回收机制深度解析---从shrink_node到页面回收实战

最新文章

Linux学习日常9

可观测性数据收集：指标、日志与链路追踪的关联分析

AI 总是乱写代码？你可能少配置了这个文件（附生成工具）

Linux下I2C设备调试全攻略：从DTB反编译到寄存器读写（附i2ctransfer命令详解）

CSDN收藏 | AI风口来袭！小白程序员如何抓住机遇，实现高薪转型？大模型岗位数据解读！

模仿学习不是“抄动作”，而是重建认知链——AIAgent中意图-动作-反馈三元耦合机制（仅限头部AI团队内部使用的建模框架）

推荐文章

⑩【从0制作自己的ros导航小车：上位机篇】05、导航！

从NUSTCTF Ezjava1看Java Web参数绑定与条件竞争漏洞挖掘

SITS2026现场直击：LLM-native NLP架构设计原则（含可复用的5层抽象模型图谱）

AHT20温湿度传感器库深度解析与工业级应用实践

Rust的引用计数智能指针Rc与Arc在线程共享中的内部可变性

libhv实战：从零构建一个功能完备的HTTP客户端

相关文章

高效掌握多步提示工程：进阶AI任务处理的系统方法论

浏览器资源嗅探终极指南：如何轻松下载网页视频与音频

OPEN实战：基于深度强化学习的多无人机追逃在线规划，如何跨越仿真到现实的鸿沟？

从Depth Anything到Video版本：揭秘字节跳动如何用时空注意力突破视频深度估计瓶颈

终极指南：如何使用ChampR构建高性能英雄联盟游戏助手

GLM-4.1V-9B-Base效果展示：中文手绘草图→功能描述→技术实现建议生成

分享文章

更多文章

专业数据恢复：如何轻松解密微信聊天记录的终极方案

day2项目打卡与leetcode一题

Cyber Engine Tweaks：3步解锁《赛博朋克2077》终极游戏体验

WebRTC客户端开发避坑指南：手把手解决Ubuntu下摄像头采集、SDL2渲染与ZLMediakit信令对接

9.4 推送通知

IMU与GPS数据融合定位：基于位姿状态方程的EKF算法从MATLAB到C++的代码实现解析

医疗设备EMC整改时，Y电容怎么选才能不超标漏电流？一个案例讲清楚

Colab新手入门：从零开始的高效云端开发指南

别再改 Header 了：高价值窗口里，先暴露的是协议和环境不一致

深入解析BioBERT：高效生物医学文本挖掘的实战应用完全指南

如何高效使用BUAAthesis：北航毕业论文LaTeX模板的完整指南

软件可靠性测试报告到底该怎么写