【发布时间】:2021-02-19 01:57:59
【问题描述】:
我正在尝试计算组合列的唯一值,并将它们放入数据框中,我有两列。一列称为“市政”,另一列称为“日期”。市镇有 27 个不同的名称,而日期每个市镇有 151 个日期,总共 4,077 行。我可以将这两个放在一个数据框中,但我无法得到计数。即
days1 = (df['Municipality'])
days = days1[5247:9324].reset_index(drop=True)
ddate1 = (df['Date'])
ddate = ddate1[5247:9324].reset_index(drop=True)
frames = [days, ddate]
result = pd.concat(frames, axis = 1)
result
Municipality Date
0 Alta Floresta D'Oeste 2020-03-27
1 Alta Floresta D'Oeste 2020-03-28
2 Alta Floresta D'Oeste 2020-03-29
3 Alta Floresta D'Oeste 2020-03-30
4 Alta Floresta D'Oeste 2020-03-31
... ... ...
4072 Alto Paraíso 2020-08-20
4073 Alto Paraíso 2020-08-21
4074 Alto Paraíso 2020-08-22
4075 Alto Paraíso 2020-08-23
4076 Alto Paraíso 2020-08-24
4077 rows × 2 columns
目标是让每个自治市 (27) 并计算每个自治市的日期,每个自治市应为 151。新手,非常感谢您的帮助。
【问题讨论】: