记一次Linux系统内存占用较高得排查

作者:牧原


背景:收到报警,系统的内存使用率触发阈值(部分图是后补的)
记一次Linux系统内存占用较高得排查
1,登陆系统,使用命令查看内存分配


top 按M

记一次Linux系统内存占用较高得排查


free -m

记一次Linux系统内存占用较高得排查


atop

看下内存分配(cat /proc/meminfo 也可以看到一些细化的内存使用信息)
记一次Linux系统内存占用较高得排查
2,发现cache才1.7g,slab非常高,4.4g ,slab内存简单理解为是系统占用的
使用slabtop继续分析
记一次Linux系统内存占用较高得排查
3,看到proc_inode_cache使用的最多,这个代表是proc文件系统的inode的占用的。
4,查进程,但是进程不多,再查线程,可以通过如下命令进行检查。


ps -eLf

得到如下的结果:(没有原图了,这里补得图,用云盾做介绍)
记一次Linux系统内存占用较高得排查
计算socket


ll /proc/22360/task/*/fd/ |grep socket |wc -l

记一次Linux系统内存占用较高得排查


ll /proc/22360/task/*/fd/  |wc -l

计算一下有多少fd
记一次Linux系统内存占用较高得排查
5,每个socket的inode也不一样
记一次Linux系统内存占用较高得排查
当时看到的现场有几万个fd,基本全是socket,每个inode都是占用空间的,且proc文件系统是全内存的。 所以我们才会看到slab中proc_inode_cache内存占用高


后续:
优化相关的server端~


上一篇:系统启动提示oom的处理过程


下一篇:一次OOM问题排查