【发布时间】:2020-03-28 12:24:43
【问题描述】:
我正在针对多个指标创建监控警报。
我在下面举两个例子: 1) 数据流作业失败 2) 防火墙规则更改或插入新规则
从中创建基于日志的指标和警报很好。但它非常通用。如何确定特定细节,例如此数据流作业(作业名称)失败或此用户创建的数据流作业失败? 防火墙规则也一样,我怎么知道哪条规则更新了?
如何在警报消息本身中包含有问题的作业名称或查明资源?
对于我提供的示例,配置如下 -
防火墙更新指标是使用以下过滤器创建的:
resource.type="gce_firewall_rule" AND jsonPayload.event_subtype="compute.firewalls.patch" OR jsonPayload.event_subtype="compute.firewalls.insert"
对于数据流失败的作业,度量资源管理器中有可用的度量 - is_failed
【问题讨论】:
标签: policy stackdriver google-cloud-stackdriver google-cloud-monitoring