【问题标题】:Send alert if Azure ML pipeline fails如果 Azure ML 管道失败,则发送警报
【发布时间】:2022-07-22 12:27:07
【问题描述】:

如果 Azure ML 管道失败,我正在尝试添加警报。看起来其中一种方法是在 Azure 门户中创建监视器。问题是我找不到正确的信号名称(设置条件时需要),这将识别管道失败。我应该使用什么信号名称?或者如果 Azure 管道失败,是否有其他方式发送电子邮件?

【问题讨论】:

    标签: azure azureportal azure-machine-learning-service


    【解决方案1】:

    我应该使用什么信号名称?

    您可以使用AmlPipelineEvent 表的PipelineChangeEvent 类别查看访问(读取、创建或删除)ML 管道草案或端点或模块时的事件。

    例如,使用AmlComputeJobEvent 获取过去五天失败的作业:

    AmlComputeJobEvent
    | where TimeGenerated > ago(5d) and EventType == "JobFailed"
    | project  TimeGenerated , ClusterId , EventType , ExecutionState , ToolType
    

    更新答案:

    根据Laurynas G

    AmlRunStatusChangedEvent 
    | where Status == "Failed" or Status == "Canceled"
    

    您可以参考Monitor Azure Machine LearningLog & view metrics and log filesTroubleshooting machine learning pipelines

    【讨论】:

    • 好吧,在 porta.azure.com 中,我转到 Monitor -> Alerts -> Create Alert Rule -> Condition,我既找不到 PipelineChangeEvent,也找不到 AmlComputeJobEvent
    • 我最终使用了以下内容,但我认为可以接受这个答案 AmlRunStatusChangedEvent |其中状态 ==“失败”或状态 ==“取消”
    猜你喜欢
    • 1970-01-01
    • 2022-12-14
    • 2019-06-02
    • 2020-04-28
    • 2021-09-14
    • 2019-02-23
    • 2020-01-30
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多