深圳幻海软件技术有限公司 欢迎您!

Linux服务器问题排查思路及常用命令

2023-02-27

 作为一名合格的开发人员,特别是做后端的同学,经常会遇到各种各样的问题。内存问题free命令用于查看内存的使用情况,在Linux上,很多人会用top显示系统内存,但是不够直观,top通常我们用于查看CPU的占用率。Linux下查看内容的专用工具是free命令。  各项指

 作为一名合格的开发人员,特别是做后端的同学,经常会遇到各种各样的问题。

内存问题

free命令用于查看内存的使用情况,在Linux上,很多人会用top显示系统内存,但是不够直观,top通常我们用于查看CPU的占用率。Linux下查看内容的专用工具是free命令。

 

 

各项指标的意义如下:

  • total:总表示物理内存的大小;
  • used:已使用的内存大小;
  • free:可用内存大小;
  • shared:多个进程共享的内存总额;
  • buff/cached:磁盘缓存的大小;
  • available:应用程序能使用的物理内存大小。

free与available的区别

free是真实未被使用的物理内存大小,而available是应用程序可用内存大小

 

available ≈ free + buffer + cache 
  • 1.

CPU问题

除了用top命令,我们还可以使用更为直观的pidstat命令

 

 

一般我们关注PID和%CPU两项指标即可。

磁盘IO异常问题

iotop命令可以用于查看正在写磁盘的进程ID信息,它可以帮助我们找到导致磁盘IO异常的进程。

 

 

如果各项指标都很低,那么则可能是系统磁盘问题,可以用dmesg命令查看系统信息:

 

 

如果是磁盘写满了,按照以下思路找到对应的文件并删除

1.找出最大的五个目录

 

du -hm / --max-depth=1 | sort -nr | head -5 
  • 1.

2.找出当前目录下大于1G的文件

 

find . -type f -size +1000M 
  • 1.

3.假如找到nginx日志access.log,那么我们可能得清空对应的日志文件

 

echo "">access.log.log 
  • 1.

很多人的第一反应是用rm命令

 

rm -rf access.log 
  • 1.

虽然rm可以删除文件,但是有时空间不会被立即释放,比如该例子,nginx服务仍在运行,除非重启该服务。

查看压缩好的备份日志

 

bzgrep ‘192.168.1.100’ access-2020-04-06.log 
  • 1.

为什么要用bzgrep,因为如果解压后再查看会耗费很长的时间。

查看网站并发连接数

比如查看Nginx的并发连接情况,以便我们了解网站的负载情况。

执行以下命令:

 

netstat -n | awk '/^tcp/ {++S[$NF]} END {for(a in S) print a, S[a]}' 
  • 1.

结果:

 

 

ESTABLISHED的数量就是当前并发连接数。

访问量统计

很多时候网站会遭遇恶意攻击,我们需要找到出问题的IP进行封杀。

查询访问最频繁的IP

 

awk '{print $1}' access-2020-04-06.log | sort | uniq -c | sort -n -k 1 -r | more 
  • 1.

其他需求

如根据访问IP统计UV

 

awk '{print $1}' access-2020-04-06.log | sort | uniq -c | wc -l 
  • 1.