【发布时间】:2019-03-31 13:51:06
【问题描述】:
我想将 pandas 数据帧转换为带有 groupby 标签的 numpy 数组。 在 groupby 中,我必须使用正则表达式进行分组,因此带上它的标签很重要。
我的数据格式为:
start_date,is_member
2014-04-15 00:01,1
2014-04-15 00:01,1
2014-04-15 01:01,1
2014-04-15 01:01,1
2014-04-15 02:02,1
2014-04-15 03:05,1
我试过了
df = pd.read_csv(filename, header=0)
df = df.groupby(df.start_date.str.extract("^(.*?)\:", expand=False))[['start_date']].count()[['start_date']]
print(df)
数据框的输出是
start_date
2014-04-15 00 2
2014-04-15 01 2
2014-04-15 02 1
2014-04-15 03 1
我试过用
将它转换成 numpy 数组numpy_array = df.values
numpy 数组的输出就是计数值
[[2]
[2]
[1]
[1]]
我希望它以 startdate 作为列。
[[2014-04-15 00 2]
[2014-04-15 01 2]
[2014-04-15 02 1]
[2014-04-15 03 1]]
【问题讨论】: