基于 Java 的互联网应用 应该监控那些指标
- 操作系统层面
- cpu 使用率;
- 内存使用率;
- 磁盘使用情况;
网络使用情况;
- JVM 层面
- Jvm cpu 使用情况;
- gc overhead;
- gc count;
- gc 每次回收后的使用情况;
- jfr 的重要指标;
- Jvm memory available;
oom error count;
- 应用框架层面
- 作为 service client 调用下游时候的 成功/失败次数, 平均时间;
调用外部数据存储的 成功/失败次数, 平均时间;
- 应用层面
- tps/ops;
- transaction time;
- 5xx count;
- 4xx count;
- app busy threads;
- app total thread count;
- error count;