【发布时间】:2016-01-28 02:06:41
【问题描述】:
我有一个根据以下变量索引的数据框:名称 - 日期。名称是某种奇怪的 ID,而日期是.. 一个日期。
数据非常大,我想检查我拥有的几个随机选择 NAME 的数据。
也就是说,
- 从可能的名称中随机选择一个名称
- 检查此 NAME 的数据,按时间排序。
我不知道该怎么做。我看到我们可以使用get_level_values,但是我并没有具体的名字,我只是想多次调用随机样本。
任何帮助表示赞赏! 谢谢!
【问题讨论】:
-
是多索引还是“名称-日期”形式的索引?
-
多索引
df=set_index(['name','date'])
标签: python pandas random-sample