【发布时间】:2016-01-16 00:35:47
【问题描述】:
我从一个看起来像这样的 Pandas 数据框开始:
Type Date Number
1 A x y
2 B x y
3 A x y
4 B x y
5 A x y
我想分别为 A 类数据和 B 类数据创建单独的时间序列。最有效的方法是什么?
我正在考虑从中创建两个不同的数据帧,其中每个数据仅包含一种类型的数据,然后将每个单独的数据帧转换为一个系列。但是我也不知道该怎么做。
扩展问题:如果您甚至不知道有多少种不同的类型,有没有办法做到这一点?
到目前为止,我尝试使用df["type"] == A 检查该类型是否属于我想要的类型,但这并没有给我一个完整的数据框,只是一个数据框告诉我该类型是真还是假。
附加信息:
我的目标是使用A 类型和B 类型的日期和数字数据分别创建单独的熊猫时间序列。
我尝试了以下方法:
df.groupBy("Type").apply(lambda x: x.Date)
上述函数有效,但只返回一列。
df.groupBy("Type").apply(lambda x: (x.Date, x.Number))
上面的函数不起作用,返回的东西根本不是我想要的。
预期输出:
Type Date Number
A 1 x y
3 x y
5 x y
B 2 x y
4 x y
【问题讨论】:
-
请添加预期的输出。
标签: python pandas time-series dataframe