【发布时间】:2021-07-22 19:03:18
【问题描述】:
考虑关注 sklearn Pipeline:
pipeline = make_pipeline(
TfidfVectorizer(),
LinearRegression()
)
我已经预训练了TfidfVectorizer,所以当我调用pipeline.fit(X, y) 时,我只想安装LinearRegression 而我不想改装TfidfVectorizer。
我可以提前应用转换并在转换后的数据上拟合 LinearRegression,但在我的项目中,我的管道中有很多转换器,其中一些是预训练的,有些不是,所以我是寻找一种不围绕 sklearn 估计器编写另一个包装器并保持在一个 Pipeline 对象的范围内的方法。
在我看来,它应该是 estimators 对象中的一个参数,表示在调用 .fit() 时如果对象已安装,则不重新安装对象。
【问题讨论】:
标签: python machine-learning scikit-learn pipeline model-fitting