【问题标题】:equivalent of R's View for Python's pandas相当于 Python 的 pandas 的 R 视图
【发布时间】:2014-03-17 01:54:15
【问题描述】:

View 是一个非常有用的函数,可以让我看到 R 中大数据框的横截面。

对于 Python 的 pandas DataFrame,是否有任何等效于 R 的 View 函数?

我对 R 使用 RStudio,对 Python 使用 PyCharm

【问题讨论】:

  • .describe() 方法和.head().tail() 工作得很好。我建议对这些方法感到满意。一旦你处理超过几千行的数据,查看全帧不仅没有帮助,而且会给你的机器带来巨大的负担......
  • 不。这些没有帮助。 head 和 tail(在 R 和 pandas 中)只提供有限的视图,并不能帮助我发现问题。我对 pandas 的相应 View 函数特别感兴趣。 head 和 tail 可以检查代码是否正常运行,而不是数据可视化的替代品。
  • 我听到了。但我要告诉你尝试远离R 中的View 函数。 View 不是“数据可视化”,而是显示数据的表格。但要回答您的问题,pandas 没有任何东西可以打开一个显示完整数据的新窗口。
  • @Justin “你的机器上的巨大负担”不适用于 RStudio,它的 View() 函数以块的形式动态加载数据,让您可以排序、过滤等。
  • "pandas 肯定比 R 快..." 完全错误:见这里github.com/Rdatatable/data.table/wiki/Benchmarks-:-Grouping

标签: python r pandas pycharm


【解决方案1】:

一个更快的选择可能是设置 pandas 数据框,这样它就不会通过放置这行代码来换行:

import pandas
pandas.set_option('expand_frame_repr', False)

我正在使用 Sublime Text 2,它的外观是这样的:

在输入选项之前(注意输出如何环绕文本)

放入选项后(注意输出如何继续)

还要确保未选中“查看”>“自动换行”。

此外,您可以通过使用 head(#) 来根据需要或多或少地打印出来,如下所示:

mydf = pandas.DataFrame.from_csv('myfile.csv', header=1)
print mydf.head(20) # Prints first 20 lines

这里有一些其他的 pandas 选项:

pandas.set_option('display.max_columns', 0) # Display any number of columns
pandas.set_option('display.max_rows', 0) # Display any number of rows

【讨论】:

  • 借助 PyCharm,您可以使用调试器并使用“运行”>“评估表达式”。默认情况下您可以查看 NumPy,现在它似乎不支持 DataFrame,但您可以评估 mydf.as_matrix() 以查看 DataFrame 内容。
  • 不是只有在调试的时候才激活吗?
  • 是的,很遗憾只有调试器。
【解决方案2】:

Anaconda 中的 Spyder(或我喜欢称之为 Python 的 R Studio)使您能够像在 R 中使用变量资源管理器一样查看和排序整个数据帧。

https://www.continuum.io/

【讨论】:

  • 如果看不到表格,请尝试重启spyder
【解决方案3】:

如果你是一个普通的 R 用户并且也使用 python,并且你更喜欢 R studio,那么我建议你使用 R Studio 来编写 python 脚本。 您可以使用 reticulate 库。 reticulate::conda_python() 将带您到 python 控制台并编写脚本,只需从菜单中创建新的 python 脚本。 接下来考虑以下用python编写的代码:

import pandas as pd
df_python = pd.DataFrame({'num_legs': [2, 4, 8, 0],
               'num_wings': [2, 0, 0, 0],
               'num_specimen_seen': [10, 2, 1, 8]},
              index=['falcon', 'dog', 'spider', 'fish'])

这将创建一个 pandas 数据框 df_python

现在使用 exit 关键字退出 python 控制台。现在,当您将使用 py$ 时,您可以访问 python 对象。这也可以让您在 R 中使用此数据框,因此您也可以使用 View(py$df_python) 查看数据框,您将获得以下输出。

继续编码!

【讨论】:

    【解决方案4】:

    在 ipython(笔记本或 qtconsole)中,你可以这样做:

    from IPython.display import HTML
    HTML(myDataFrame.to_html())
    

    对 pycharm 没有帮助,但可能值得追求。

    【讨论】:

    • 一定是关于我的设置。
    • 它让你的笔记本崩溃=/
    猜你喜欢
    • 2017-04-16
    • 2022-01-18
    • 1970-01-01
    • 1970-01-01
    • 2019-09-08
    • 1970-01-01
    • 1970-01-01
    • 2014-10-31
    • 2017-09-10
    相关资源
    最近更新 更多