【发布时间】:2014-04-09 17:22:37
【问题描述】:
我有一个如下形式的数据框(例如)
shopper_num,is_martian,number_of_items,count_pineapples,birth_country,tranpsortation_method
1,FALSE,0,0,MX,
2,FALSE,1,0,MX,
3,FALSE,0,0,MX,
4,FALSE,22,0,MX,
5,FALSE,0,0,MX,
6,FALSE,0,0,MX,
7,FALSE,5,0,MX,
8,FALSE,0,0,MX,
9,FALSE,4,0,MX,
10,FALSE,2,0,MX,
11,FALSE,0,0,MX,
12,FALSE,13,0,MX,
13,FALSE,0,0,CA,
14,FALSE,0,0,US,
如何使用Pandas计算每列的汇总统计(列数据类型可变,有些列没有信息
然后返回表单的一个数据框:
columnname, max, min, median,
is_martian, NA, NA, FALSE
等等等等
【问题讨论】:
标签: python pandas csv dataframe profiling