【问题标题】:Having a problem viewing dataframes in Colab在 Colab 中查看数据框时出现问题
【发布时间】:2020-09-13 22:05:30
【问题描述】:

我正在尝试将 sklearn 数据集视为 Colab 笔记本中的 Pandas 数据框。

通过别人的建议,我找到了命令

%load_ext google.colab.data_table

非常有帮助。例如下面的代码是用于加载和查看知名的wine数据集

import pandas as pd
%load_ext google.colab.data_table
from sklearn.datasets import load_wine
data = load_wine()
df = pd.DataFrame(data['data'], columns=data['feature_names'])
df['target'] = data['target']
df

在结果单元格中,我可以选择希望在一页上查看多少行。浏览数据真的很棒。

然后我对威斯康星州的乳腺癌数据进行了同样的尝试:

import pandas as pd
%load_ext google.colab.data_table
from sklearn.datasets import load_breast_cancer
data = load_breast_cancer()
df = pd.DataFrame(data['data'], columns=data['feature_names'])
df['target'] = data['target']
df

现在,没有这样的选项来选择我希望在一页上查看多少行。

我很想知道不同的结果是否可能与特定 sklearn 数据集中的任何不同格式有关。

【问题讨论】:

  • 你在使用 jupyter 吗?
  • 不,它在 Google Colab 笔记本中。虽然我在自己的工作中使用了 Jupyter,但它被用于线性代数课程的教学目的。

标签: python pandas


【解决方案1】:

您可以使用 pandas 数据帧的“.head(n)”方法来指定在 colab(或任何其他 shell/IDE)中显示的行数,其中 n 是您希望显示的行数。为了查看所有显示的行,将“display.max_rows”设置为“无”。下面 显示乳腺癌数据集中的前 40 行。

import pandas as pd
from sklearn.datasets import load_breast_cancer

pandas.set_option('display.max_rows', None)   

data = load_breast_cancer()
df = pd.DataFrame(data['data'], columns=data['feature_names'])
df['target'] = data['target']
df.head(40)

虽然乳腺癌数据集没有交互式下拉“按页显示”选项卡,但这应该足以让您在 DataFrame 中查看您想要的所有行。

【讨论】:

  • 您知道如何让数据在每列中居中显示吗?
  • 请看这个帖子; link。只需将“rightt”更改为“中心”
猜你喜欢
  • 2011-03-21
  • 1970-01-01
  • 2011-06-14
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2021-04-21
  • 1970-01-01
相关资源
最近更新 更多