前言:

Java与C++之间有一堵由内存动态分配和垃圾收集技术所围成的“高墙”,墙外面的人想
进去,墙里面的人却想出来。

SRE实战 互联网时代守护先锋,助力企业售后服务体系运筹帷幄!一键直达领取阿里云限量特价优惠。

 

4.1、概述

给一个系统定位问题的时候,知识、经验是关键基础,数据是依据,工具是运用知识处
理数据的手段。这里说的数据包括:运行日志异常堆栈GC日志线程快照
(threaddump/javacore文件)、堆转储快照(heapdump/hprof文件)等。经常使用适当的虚拟
机监控和分析的工具可以加快我们分析数据、定位解决问题的速度。

------工具永远都是知识技能的一层包装

 

4.2、JDK的命令行

JDK的bin目录中有“java.exe”、“javac.exe”这两个命令行工具

每逢JDK更新版本之时,bin目录下命令行工具的数量和功能总会不知不觉地增加和增强

如图所示:展示一部分

4、JVM-虚拟机性能监控与故障处理工具 随笔 第1张

 

这些工具的程序提及非常小

这些命令行工具大多数jdk/lib/tools.jar类库的一层包装而已

主要的功能实现代码是在tools类库中实现的

 

若是使用Linux的JDK,可以发现这些工具中就是Shell直接写成的

可以使用vim打开

 

当应用程序部署到生产环境后

无论是直接接触物理服务器还是远程Telent到服务器都可能收到限制

借助tools.jar类库中的接口

可以直接在应用程序中实现强大的监控分析功能

 

JDK主要命令行以及监控工具的用途:

4、JVM-虚拟机性能监控与故障处理工具 随笔 第2张

4、JVM-虚拟机性能监控与故障处理工具 随笔 第3张

 

4.2.1、jps:虚拟机进程工具

JDK的很多小工具都参考了UNIX命令的命名方式

jps(JVM Process StatusTool)是其中的典型

 

除列名字项UNIX的ps命令方式之外

它的功能也和ps命令类似:

可以列出正在运行的虚拟进程

并显示虚拟机执行主类(Main、Class、main()函数所在类)名称

以及这些进程在本地虚拟机唯一ID(Local Virtual Machine Identifier,LVMID

 

虽然功能比较单一

但是是使用频率最高的JDK命令工具

因为其他的JDK工具大多需要输入它查询到的LVMID来确定需要监控的哪一个虚拟机

 

对于本地虚拟机来说

LVMID与操作系统进程ID是一致的

使用Windows的任务管理器或者UNIX的ps命令也可以查询到虚拟机进程的LVMID

但是吐过同时启动了多个虚拟机进程

无法根据进程名进行定位时,此时只能依赖jps命令来显示

 

jps命令格式:

jps [options][hostid]

jps可以通过RMI协议查询开启了RMI服务的远程虚拟机进程状态

hostid:为RMI注册表中的注册主机名

其他选项:

4、JVM-虚拟机性能监控与故障处理工具 随笔 第4张

 

执行效果:

test1是正在运行的main函数

4、JVM-虚拟机性能监控与故障处理工具 随笔 第5张

 

4.2.2、jstat:虚拟机统计信息监控工具

jstat(JVM Statistics Monitoring Tool)是用于监视虚拟机中各种运行状态信息的命令工具

在没有GUI图形界面,只提供了纯文本的控制台环境的服务器上

将是运行期定位虚拟机性能问题的首选工具

 

命令格式:

jstat[option vmid[interval[s|ms][count]]]

对于命令格式中的VMID与LVMID需要特别说明一下:

如果是本地的虚拟进程,VMID与LVMID是一致的

 

如果是远程虚拟进程,那么VMID的格式应当是:

[protocol:][//]lvmid[@hostname[:port]/servername]

 

参数interval和count代表查询间隔和次数,如果省略这两个参数,说明只查询一次。假设
需要每250毫秒查询一次进程2764垃圾收集状况,一共查询20次,那命令应当是:

jstat-gc 2764 250 20

 

选项option代表着用户希望查询的虚拟机信息,主要分为3类:类装载垃圾收集、运
期编译状况

4、JVM-虚拟机性能监控与故障处理工具 随笔 第6张

 

4、JVM-虚拟机性能监控与故障处理工具 随笔 第7张

Survivor区:S0、S1

老年代:O

 

Minor GC(YGG):14次

YGCT总耗时0.466秒

 

FUll GC(FGG):0次

FGCT(FUll GC总耗时)

 

所有GC总耗(GCT):0.466

 

4.2.3、jinfo:java配置信息工具

jinfo(Configuration Info for Java)的作用是实时地查看和调整虚拟机各项参数

 

使用jps命令的-v参数可以查看虚拟机启动时显式指定的参数列表

但如果想知道未被显式指定的参
数的系统默认值,除了去找资料外,就只能使用jinfo的-flag选项进行查询了(如果只限于
JDK 1.6或以上版本的话,使用java-XX:+PrintFlagsFinal查看参数默认值也是一个很好的选
择),jinfo还可以使用-sysprops选项把虚拟机进程的System.getProperties()的内容打印出
来。这个命令在JDK 1.5时期已经随着Linux版的JDK发布,当时只提供了信息查询的功
能,JDK 1.6之后,jinfo在Windows和Linux平台都有提供,并且加入了运行期修改参数的能
力,可以使用-flag[+|-]name或者-flag name=value修改一部分运行期可写的虚拟机参数值。
JDK 1.6中,jinfo对于Windows平台功能仍然有较大限制,只提供了最基本的-flag选项。

 

命令格式:

jinfo [option] pid

4、JVM-虚拟机性能监控与故障处理工具 随笔 第8张

 

4.2.4、jmap:java内粗你映像工具

jmap(Memory Map for Jav)用于生成堆快照(一般称为heapdump或dump文件)

 

不适用jmap来获取Java堆快照存储还可以使用-XX:+HeapDumpOnOutOfMemoryError参数

还可以让虚拟机在OOM以尝出现之后生成dump文件

 

通过-XX:+HeapDumpOnCtrlBreak参数可以使用ctrl + break键让虚拟机生成dump文件

 

在Linux下使用kill -3命令阿松进程退出信息也能拿到dump文件

 

jmap [option] vmid

 

除了生成dump文件的-
dump选项和用于查看每个类的实例、空间占用统计的-histo选项在所有操作系统都提供之
外,其余选项都只能在Linux/Solaris下使用。

4、JVM-虚拟机性能监控与故障处理工具 随笔 第9张

 

4.2.5、jhat:虚拟机堆快转储快照分析工具

Sun JDK提供jhat(JVM Heap Analysis Tool)命令与jmap搭配使用,来分析jmap生成的堆
转储快照。

 

jhat内置了一个微型的HTTP/HTML服务器,生成dump文件的分析结果后,可以在
浏览器中查看。

 

一般不会使用jhat区分析dump文件:

1、一般不会在部署

应用程序的服务器上直接分析dump文件,即使可以这样做,也会尽量将dump文件复制到其
他机器上进行分析,因为分析工作是一个耗时而且消耗硬件资源的过程,既然都要在其他
机器进行,就没有必要受到命令行工具的限制了

2、是jhat的分析功能相对来说比

较简陋,对于VisualVM,以及专业用于分析dump文件的Eclipse Memory
Analyzer、IBM HeapAnalyzer等工具,都能实现比jhat更强大更专业的分析功能

 

 

4.2.6、jstack:java堆栈跟踪工具

jstack(Stack Trace for Java)命令用于生成虚拟机当前时刻的线程快照(一般称为
threaddump或者javacore文件)。

 

线程快照就是当前虚拟机内每一条线程正在执行的方法堆栈
的集合,生成线程快照的主要目的是定位线程出现长时间停顿的原因,如线程间死锁、死循
环、请求外部资源导致的长时间等待等都是导致线程长时间停顿的常见原因。

 

线程出现停顿
的时候通过jstack来查看各个线程的调用堆栈,就可以知道没有响应的线程到底在后台做些
什么事情,或者等待着什么资源。

 

命令格式:

jstack [option] vmid

4、JVM-虚拟机性能监控与故障处理工具 随笔 第10张

 

4.2.7、HSDIS:JIT生成代码反汇编

在Java虚拟机规范中,虚拟机指令集中每条指令的执行过程、执行前后对操
作数栈、局部变量表的影响等细节。

 

分析程序如何执行,通过软件调试工具(GDBWindbg等)来断点调试是最常见的手
段,但是这样的调试方式在Java虚拟机中会遇到很大困难,因为大量执行代码是通过JIT编译
器动态生成到CodeBuffer中的,没有很简单的手段来处理这种混合模式的调试(不过相信虚
拟机开发团队内部肯定是有内部工具的)。

 

HSDIS是一个Sun官方推荐的HotSpot虚拟机JIT编译代码的反汇编插件,它包含在HotSpot
虚拟机的源码之中,但没有提供编译后的程序。在Project Kenai的网站也可以下载到单独的
源码。

它的作用是让HotSpot的-XX:+PrintAssembly指令调用它来把动态生成的本地代码还
原为汇编代码输出,同时还生成了大量非常有价值的注释,这样我们就可以通过输出的代码
来分析问题。读者可以根据自己的操作系统和CPU类型从Project Kenai的网站上下载编译好
的插件,直接放到JDK_HOME/jre/bin/client和JDK_HOME/jre/bin/server目录中即可。如果没
有找到所需操作系统(譬如Windows的就没有)的成品,那就得自己使用源码编译一下

 

4.3、JDK的可视化工具

 

4.3.1、JConsole:java监视与管理控制台

JConsole(Java Monitoring and Management Console)是一种基于JMX的可视化监视
理工具。它管理部分的功能是针对JMX MBean进行管理,由于MBean可以使用代码、中间件
服务器的管理控制台或者所有符合JMX规范的软件进行访问。

 

1、启动JConsole

4、JVM-虚拟机性能监控与故障处理工具 随笔 第11张

 

4、JVM-虚拟机性能监控与故障处理工具 随笔 第12张

进行链接查看

4、JVM-虚拟机性能监控与故障处理工具 随笔 第13张

 

2、内存监控

public static void main(String[] args) {
        byte [] a = new byte[1024*240];
        List list  = new ArrayList<>();
        for(int i = 0;i <1000;i++){
            list.add(i);
        }
        try {
            Thread.sleep(10000);
        } catch (InterruptedException e) {
            e.printStackTrace();
        }
        System.gc();
    }

内存:

4、JVM-虚拟机性能监控与故障处理工具 随笔 第14张

运行System.gc()之后

整个新生代Eden和Survivor区基本上都清空了

但是代表老年代的柱状图仍然保持

说明填充进队中的数据在System.gc()方法执行之后仍然存活

 

 

虚拟机启动参数只限制了Java堆为100MB,没有指定-Xmn参数,能否从监控图中估
计出新生代有多大?

4、JVM-虚拟机性能监控与故障处理工具 随笔 第15张

 

为何执行了System.gc()之后,图中代表老年代的柱状图仍然显示峰值状态,代
码需要如何调整才能让System.gc()回收掉填充到堆中的对象?

--空间未能回收是因为List对象依然存活

--list对象在System.gc()执行时仍然处于作用于内 

 

3、线程监控

“线程”页签的功能相当于可视化的jstack命令,遇到线程停顿时可以使用这个页签进行监控分析

线程长时间停顿的主要原因主要有:等待外部资源(数据库连接、网络资源、设备资
源等)、死循环、锁等待(活锁和死锁)。

 

扫码关注我们
微信号:SRE实战
拒绝背锅 运筹帷幄