linux中如何排查Java问题

75次阅读
没有评论

共计 2311 个字符,预计需要花费 6 分钟才能阅读完成。

丸趣 TV 小编给大家分享一下 linux 中如何排查 Java 问题,相信大部分人都还不怎么了解,因此分享这篇文章给大家参考一下,希望大家阅读完这篇文章后大有收获,下面让我们一起去了解一下吧!

Linux 命令类

tail
最常用的 tail -f

grep

awk

1 基础命令

2 匹配

3 内建变量

NR:NR 表示从 awk 开始执行后,按照记录分隔符读取的数据次数,默认的记录分隔符为换行符,因此默认的就是读取的数据行数,NR 可以理解为 Number of Record 的缩写。

FNR: 在 awk 处理多个输入文件的时候,在处理完第一个文件后,NR 并不会从 1 开始,而是继续累加,因此就出现了 FNR,每当处理一个新文件的时候,FNR 就从 1 开始计数,FNR 可以理解为 File Number of Record。

NF: NF 表示目前的记录被分割的字段的数目,NF 可以理解为 Number of Field。

find

pgm

批量查询 vm-shopbase 满足条件的日志

tsar

tsar 是咱公司自己的采集工具。很好用, 将历史收集到的数据持久化在磁盘上,所以我们快速来查询历史的系统数据。当然实时的应用情况也是可以查询的啦。大部分机器上都有安装。

top

top 除了看一些基本信息之外,剩下的就是配合来查询 vm 的各种问题了

获得线程 10 进制转 16 进制后 jstack 去抓看这个线程到底在干啥

其他

排查利器

btrace
首当其冲的要说的是 btrace。真是生产环境 预发的排查问题大杀器。简介什么的就不说了。直接上代码干

1、查看当前谁调用了 ArrayList 的 add 方法,同时只打印当前 ArrayList 的 size 大于 500 的线程调用栈

2、监控当前服务方法被调用时返回的值以及请求的参数

注意:

经过观察,1.3.9 的 release 输出不稳定,要多触发几次才能看到正确的结果

正则表达式匹配 trace 类时范围一定要控制,否则极有可能出现跑满 CPU 导致应用卡死的情况

由于是字节码注入的原理,想要应用恢复到正常情况,需要重启应用。

Greys

说几个挺棒的功能 (部分功能和 btrace 重合):

sc -df xxx: 输出当前类的详情, 包括源码位置和 classloader 结构

trace class method: 相当喜欢这个功能! 很早前可以早 JProfiler 看到这个功能。打印出当前方法调用的耗时情况,细分到每个方法。

javOSize

就说一个功能
classes:通过修改了字节码,改变了类的内容,即时生效。所以可以做到快速的在某个地方打个日志看看输出,缺点是对代码的侵入性太大。但是如果自己知道自己在干嘛,的确是不错的玩意儿。

其他功能 Greys 和 btrace 都能很轻易做的到,不说了。

JProfiler

之前判断许多问题要通过 JProfiler,但是现在 Greys 和 btrace 基本都能搞定了。再加上出问题的基本上都是生产环境 (网络隔离),所以基本不怎么使用了,但是还是要标记一下。

大杀器

eclipseMAT
可作为 eclipse 的插件,也可作为单独的程序打开。

Java 三板斧,噢不对,是七把

jps
我只用一条命令:

jstack

普通用法:

native+java 栈:

jinfo

可看系统启动的参数,如下

jmap

两个用途

1. 查看堆的情况

2.dump

或者

3. 看看堆都被谁占了? 再配合 zprofiler 和 btrace,排查问题简直是如虎添翼

jstat

jstat 参数众多,但是使用一个就够了

jdb

时至今日,jdb 也是经常使用的。
jdb 可以用来预发 debug, 假设你预发的 java_home 是 /opt/taobao/java/,远程调试端口是 8000. 那么
sudo -u admin /opt/taobao/java/bin/jdb -attach 8000.

出现以上代表 jdb 启动成功。后续可以进行设置断点进行调试。

CHLSDB

CHLSDB 感觉很多情况下可以看到更好玩的东西,不详细叙述了。查询资料听说 jstack 和 jmap 等工具就是基于它的。

plugin of intellij idea

key promoter

快捷键一次你记不住,多来几次你总能记住了吧?

maven helper

分析 maven 依赖的好帮手。

VM options

1、你的类到底是从哪个文件加载进来的?

2、应用挂了输出 dump 文件

jar 包冲突

把这个单独写个大标题不过分吧?每个人或多或少都处理过这种烦人的 case。我特么下边这么多方案不信就搞不定你?

打出所有依赖

只打出指定 groupId 和 artifactId 的依赖关系

vm 启动脚本加入。在 tomcat 启动脚本中可见加载类的详细信息

vm 启动脚本加入。在 tomcat 启动脚本中可见加载类的详细信息

greys 的 sc 命令也能清晰的看到当前类是从哪里加载过来的

其他

dmesg
如果发现自己的 java 进程悄无声息的消失了,几乎没有留下任何线索,那么 dmesg 一发,很有可能有你想要的。

去找关键字 oom_killer。找到的结果类似如下:

以上表明,对应的 java 进程被系统的 OOM Killer 给干掉了,得分为 854.
解释一下 OOM killer(Out-Of-Memory killer),该机制会监控机器的内存资源消耗。当机器内存耗尽前,该机制会扫描所有的进程(按照一定规则计算,内存占用,时间等),挑选出得分最高的进程,然后杀死,从而保护机器。

dmesg 日志时间转换公式:
log 实际时间 = 格林威治 1970-01-01+(当前时间秒数 - 系统启动至今的秒数 +dmesg 打印的 log 时间) 秒数:

以上是“linux 中如何排查 Java 问题”这篇文章的所有内容,感谢各位的阅读!相信大家都有了一定的了解,希望分享的内容对大家有所帮助,如果还想学习更多知识,欢迎关注丸趣 TV 行业资讯频道!

正文完
 
丸趣
版权声明:本站原创文章,由 丸趣 2023-08-25发表,共计2311字。
转载说明:除特殊说明外本站除技术相关以外文章皆由网络搜集发布,转载请注明出处。
评论(没有评论)