【问题标题】:Post Processing in Machine Learning Classfier机器学习分类器中的后处理
【发布时间】:2021-04-01 04:23:16
【问题描述】:

我在寻找有关这件事的材料时遇到了麻烦。不知道具体搜索什么。

我正在尝试获取我的 Logistic 回归分类器(输出时间序列二进制类)的结果,并制作一个过滤器,该过滤器采用 X 个答案的窗口,如果该给定窗口的正数大于给定阈值,只有这样样本才会得到肯定。

我的输入是一个时间序列,其中包含公司流程的许多特征,例如电流、压力等。我正在尝试制作故障检测算法。所以因为我的输出太吵了,我想让它在时间上更加一致。

Classfier Pattern

【问题讨论】:

  • 与机器学习无关,你想要的是二进制系列的窗口函数,这个系列的来源无关紧要。实现这样一个窗口函数非常简单,但是,您的问题没有提及如何在技术方面提供该系列,因此无法回答。
  • 嗨@DannyVarod 我添加了一些信息。你能指出我正确的方向吗?这就是我所需要的。我不知道如何搜索这方面的材料,我所有的谷歌搜索都给了我图像处理过滤器,我没有找到二进制类时间一致性过滤器。
  • Higor,尝试将标签替换为相关标签,即删除所有现有标签,添加相关标签,例如'蟒蛇, 'kafka。将代码添加到问题中(作为代码,而不是图像)。如果需要阅读链接,请不要添加链接。它们不会持久,b。没有人应该去拜访他们才能理解。

标签: machine-learning classification filtering post-processing


【解决方案1】:

解决了。

for train_index, test_index in logo.split(X, y, groups):
        X_train, X_test =  X.iloc[train_index], X.iloc[test_index]
        y_train, y_test = y[train_index], y[test_index]
        model.fit(X_train, y_train.ravel())
        y_pred = model.predict(X_test)
        y_pred_filtrado = pd.Series(y_pred).rolling(filtro,min_periods=1).sum() #getting a sum of the window
        y_pred_filtrado = np.where(y_pred_filtrado>treshold, 1, 0) #if sum is greater than a treshhold output is positive

【讨论】:

    猜你喜欢
    • 2018-11-09
    • 1970-01-01
    • 2020-05-04
    • 2018-12-01
    • 1970-01-01
    • 2023-04-04
    • 2021-04-14
    • 1970-01-01
    • 2013-05-08
    相关资源
    最近更新 更多