【问题标题】:Sklearn regression with clustered data使用聚类数据进行 Sklearn 回归
【发布时间】:2024-01-22 05:31:01
【问题描述】:

我正在尝试使用集群数据集在sklearn 中运行多项式LogisticRegression(也就是说,每个个体有多个观察值,其中只有一些特征发生变化,而其他特征保持不变)。

我知道statsmodels 可以通过以下方式解决这个问题:

mnl = MNLogit(x,y).fit(cov_type="cluster", cov_kwds={"groups": cluster_groups)

有没有办法用 sklearn 包来复制它?

【问题讨论】:

  • 您是在寻找聚类数据集上的多类(多项)逻辑回归还是逻辑回归?
  • 我知道如何在 sklearn 中运行多项式 logit,我想了解如何在集群数据集上运行一项。
  • 你能放一个你的数据集的例子和更多的代码而不是一行吗?

标签: python scikit-learn regression cluster-analysis logistic-regression


【解决方案1】:

为了在sklearn中运行多项Logistic回归,可以使用LogisticRegression模块,然后将参数multi_class设置为multinomial

参考:https://scikit-learn.org/stable/modules/generated/sklearn.linear_model.LogisticRegression.html

【讨论】:

  • 我知道如何在 sklearn 中运行多项式 logit,我想了解如何在集群数据集上运行多项式 logit,您知道是否可以在 sklearn 中完成?