【发布时间】:2020-09-08 09:43:44
【问题描述】:
我是 python 的初学者,想从 datasets 包中导入 diabetes 数据以执行以下操作: 1-查看此数组数据的前几条记录并查看变量列表及其摘要统计信息 2-将其转换为熊猫数据框
例如,在糖尿病数据集中,如果我想在将它们转换为 pandas DF 之前查看变量名称及其类型和摘要统计信息,我应该怎么做?以及如何将其转换为 pandas DF
from sklearn import datasets
import pandas as pd
# Load the diabetes dataset
diabetes = datasets.load_diabetes()
print(diabetes)
# convert the diabetes array into pandas
diabetes2 = pd.DataFrame(diabetes) # DID NOT WORK
【问题讨论】:
-
这能回答你的问题吗? How to convert a Scikit-learn dataset to a Pandas dataset?。
df = pd.DataFrame(data=np.c_[diabetes['data'], diabetes['target']], columns=diabetes['feature_names']+['target']). -
它起作用了,但是当我尝试使用波士顿数据时,这是一个回归问题,它不起作用