【发布时间】:2020-12-01 15:44:55
【问题描述】:
我正在使用 scikit-learn 进行基本的机器学习
import pandas as pd
import numpy as np
from sklearn.pipeline import Pipeline
from sklearn.preprocessing import StandardScaler,PolynomialFeatures
from sklearn.linear_model import LinearRegression
X = df[['floors', 'waterfront','lat' ,'bedrooms' ,'sqft_basement' ,'view' ,'bathrooms','sqft_living15','sqft_above','grade','sqft_living']]
Y = df['price']
lm = LinearRegression()
lm.fit(X,Y)
但是,每当我尝试使用多种数据类型训练模型时,我都会得到
ValueError: Input contains NaN, infinity or a value too large for dtype('float64').
有人知道为什么吗?
编辑:当手动检查无限值时,我没有发现,但是当使用 python 检查时,每个值类型都有无限值
【问题讨论】:
-
您的任何特征是否包含
NaN、None或 np.inf` 值或非数字数据? -
@Varun Suvvari 您在哪里导入 pandas 以及如何初始化 df 数据框?
-
@Varun 你能提供数据样本吗?
标签: python numpy scikit-learn