【问题标题】:R - data profiling similar to pandas?R - 类似于熊猫的数据分析?
【发布时间】:2022-11-11 23:19:24
【问题描述】:

我做了一些搜索,很多推荐的软件包都做了类似的工作,但并不像我想要的那么简单。

最好我想要一个 html 输出,特别是,就像从熊猫配置文件报告中一样,我想要一个非常简单的每个变量的列表;

  1. 失踪人数(+ %)
  2. 分布

    我能找到的最接近的是 DataExplorer,它使用 create_report 并进行配置以消除很多图,但是缺少的# 在其正常形式中特别弱,因为对于宽数据集,无法解释大的“在一个图上”。

    从本质上讲,是否有另一个包可以执行 pandas 配置文件报告的功能,一次为每个变量提供缺失的 # 和分布,或者有没有办法改变 DataExplorer 来做到这一点?

【问题讨论】:

  • summary(df) 是否满足您的要求?也可以是broom::glance()skimr::skim()
  • 也试试Hmisc::describe。有很多在超过 18k 的 CRAN 软件包中执行此操作的软件包。

标签: r data-analysis exploratory-data-analysis dataexplorer


【解决方案1】:

你会考虑 suumarytools:

df |> summarytools::dfSummary() |> summarytools::stview()

【讨论】:

    猜你喜欢
    • 2023-02-05
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-01-12
    • 2015-11-07
    • 2012-09-19
    相关资源
    最近更新 更多