【发布时间】:2020-09-13 22:05:30
【问题描述】:
我正在尝试将 sklearn 数据集视为 Colab 笔记本中的 Pandas 数据框。
通过别人的建议,我找到了命令
%load_ext google.colab.data_table
非常有帮助。例如下面的代码是用于加载和查看知名的wine数据集
import pandas as pd
%load_ext google.colab.data_table
from sklearn.datasets import load_wine
data = load_wine()
df = pd.DataFrame(data['data'], columns=data['feature_names'])
df['target'] = data['target']
df
在结果单元格中,我可以选择希望在一页上查看多少行。浏览数据真的很棒。
然后我对威斯康星州的乳腺癌数据进行了同样的尝试:
import pandas as pd
%load_ext google.colab.data_table
from sklearn.datasets import load_breast_cancer
data = load_breast_cancer()
df = pd.DataFrame(data['data'], columns=data['feature_names'])
df['target'] = data['target']
df
现在,没有这样的选项来选择我希望在一页上查看多少行。
我很想知道不同的结果是否可能与特定 sklearn 数据集中的任何不同格式有关。
【问题讨论】:
-
你在使用 jupyter 吗?
-
不,它在 Google Colab 笔记本中。虽然我在自己的工作中使用了 Jupyter,但它被用于线性代数课程的教学目的。