【发布时间】:2019-07-19 23:31:53
【问题描述】:
我有一组包含带有时间戳的推文的 DataFrame。为了创建每日时间序列,我尝试在每个 DataFrame 中按天合并行。
我的解决方案是循环使用这段代码:
df_temp = df[df['created_sec'].isin(range(date_start,date_end))]
df_temp = pd.DataFrame(zip(df_temp.T.values), index= df_temp.columns)
data = data.append(df_temp.T)
虽然结果看起来不错,但循环非常缓慢和复杂,没有任何原因。另外,如果我像这样再次合并行,结果将是列表中的列表,这也是不可取的。
流程应该如下:
df = pd.DataFrame({'time': [1,2,3,4,5],
'text': ['foo', 'bar', 'foo', 'bar', 'foo']})
- 数据帧:
time text
0 1 foo
1 2 bar
2 3 foo
3 4 bar
4 5 foo
- 合并后时间
1,2,3&4,5:
time text
0 [1, 2, 3] [foo, bar, foo]
1 [4, 5] [bar, foo]
- 在稍后合并索引
[1,2,3]和[4,5]后:
time text
0 [1, 2, 3, 4, 5] [foo, bar, foo, bar, foo]
【问题讨论】: