【发布时间】:2022-07-22 12:27:07
【问题描述】:
如果 Azure ML 管道失败,我正在尝试添加警报。看起来其中一种方法是在 Azure 门户中创建监视器。问题是我找不到正确的信号名称(设置条件时需要),这将识别管道失败。我应该使用什么信号名称?或者如果 Azure 管道失败,是否有其他方式发送电子邮件?
【问题讨论】:
标签: azure azureportal azure-machine-learning-service
如果 Azure ML 管道失败,我正在尝试添加警报。看起来其中一种方法是在 Azure 门户中创建监视器。问题是我找不到正确的信号名称(设置条件时需要),这将识别管道失败。我应该使用什么信号名称?或者如果 Azure 管道失败,是否有其他方式发送电子邮件?
【问题讨论】:
标签: azure azureportal azure-machine-learning-service
我应该使用什么信号名称?
您可以使用AmlPipelineEvent 表的PipelineChangeEvent 类别查看访问(读取、创建或删除)ML 管道草案或端点或模块时的事件。
例如,使用AmlComputeJobEvent 获取过去五天失败的作业:
AmlComputeJobEvent
| where TimeGenerated > ago(5d) and EventType == "JobFailed"
| project TimeGenerated , ClusterId , EventType , ExecutionState , ToolType
更新答案:
根据Laurynas G:
AmlRunStatusChangedEvent
| where Status == "Failed" or Status == "Canceled"
您可以参考Monitor Azure Machine Learning、Log & view metrics and log files和Troubleshooting machine learning pipelines
【讨论】: