华为云-aom监控进程指导
华为云-非金融区可以通过 云监控服务 对特定进程配置监控(如下图示),但是金融区并没有这个 进程监控 的功能按钮,所以只能通过 aom(应用运维管理)来实现进程监控,下面简单记录一下配置过程。
- 参考1:华为云-配置应用发现规则
- 参考2:华为云-虚机组件指标及其维度
安装ICAgent
- 入口:AOM控制台 - 配置管理 - Agent管理
注:安装完 Agent 过一段时间再配置应用发现,否则会找不到机器。
应用发现
- 第1步,添加自定义应用发现规则,下面以监控 nginx 进程为例
注:默认的应用发现规则(Default_Rule)会自动识别 java、python、node.js三种类型进程,所以若要监控java进程可以不用再配置应用发现规则
- 第2步,定义规则名称,比如:
xxx-nginx-117-118
,这里先选择一台机器,用于在应用发现规则配置过程中预验证规则的有效性,最终需要在哪些主机执行本规则,将会在第7步进行配置。
- 第3步,发现规则设置,比如:当命令行参数中包含
nginx
,然后点击开始探测
- 第4步,探测结束,确认是否探测到要监控的进程,如果有则点击
下一步
- 第5步,添加自定义应用发现规则,定义组件的应用类型,比如
nginx
,然后点击预览组件名称
- 第6步,预览结束,可以对预览结果中的进程PID进行组件名称的自定义,比如
nginx-master-process
,再点击重新预览
- 第7步,选择可探测的主机,比如
x.x.x.117
和x.x.x.118
,点击添加
完成自定义规则的添加
组件监控
- 入口:AOM控制台 - 监控 - 组件监控,确认上一步的自定义应用发现规则已成功添加
告警规则
- 入口:AOM控制台 - 告警 - 告警规则,添加阈值
- 定义阈值,由于是监控进程的存活,所以指标选择
status
,统计方式选最大值
,阈值条件为>= 1