加入收藏 | 设为首页 | 会员中心 | 我要投稿 52站长网 (https://www.52zhanzhang.com/)- 视频服务、内容创作、业务安全、云计算、数据分析!
当前位置: 首页 > 服务器 > 系统 > 正文

生产系统CPU飙高问题排查

发布时间:2024-01-24 01:54:50 所属栏目:系统 来源:DaWei
导读:   线上问题定位,相对比较简单,难点主要在于保留现场,有了现场就能快速定位问题,以下是二种常用排查方式。  现状  系统平稳运行了2年时间,一直没出现过问题,突然这两天进行CPU占

  线上问题定位,相对比较简单,难点主要在于保留现场,有了现场就能快速定位问题,以下是二种常用排查方式。

  现状

  系统平稳运行了2年时间,一直没出现过问题,突然这两天进行CPU占用过高报警,如下:

  排查方法

  执行top命令,查看是哪个进程导致的,可以确定是pid为22168的java应用导致的:

  执行top -Hp命令,查看这个进程的那个线程导致cpu过高,如下图,可以看到是22749线程导致的:

  复制

  top -Hp 22168

  1.

  由于jstack里面的线程号为16进制,需要转换线程号为16进制,如下图得到16进制值为58dd:

  复制

  printf "%x\n" 22749

  1.

  执行jstack生成线程快照保存至1.txt文件中,22168为进程id:

  复制

  jstack 22168>1.txt

  1.

  根据16进制线程号,查询线程信息:

  复制

  grep 58dd 1.txt

  1.

  如上图,可以看到是调用DesenUtils.desen方法导致,此方法作用是数据脱敏,里面用了较为复杂的正则表达式,所以分析是由于特定字符正好遇到此正则表达式,进行大量计算导致,为了快速解决此问题,先去除掉此代码的调用,重新发布即可。

  https://cloud.tencent.com/developer/article/1780881,正则导致cpu飙高问题描述,请查看此地址。

  总结

  线上问题定位,相对比较简单,难点主要在于保留现场,有了现场就能快速定位问题,以下是二种常用排查方式:

  CPU飙高通过jstack命令,定位到线程信息。

  内存飙高通过jmap dump出堆栈信息,再通过mat这些工具定位那个类占用过多内存。

(编辑:52站长网)

【声明】本站内容均来自网络,其相关言论仅代表作者个人观点,不代表本站立场。若无意侵犯到您的权利,请及时与联系站长删除相关内容!

    推荐文章