【发布时间】:2021-11-17 05:57:39
【问题描述】:
我有一个示例数据框,如下所示。
import pandas as pd
import numpy as np
NaN = np.nan
data = {'ID':['A', 'A', 'A', 'B','B','B'],
'Date':['2021-09-20 04:34:57', '2021-09-20 04:37:25', '2021-09-20 04:38:26', '2021-09-01
00:12:29','2021-09-01 11:20:58','2021-09-02 09:20:58'],
'Name':['xx',NaN,NaN,'yy',NaN,NaN],
'Height':[174,NaN,NaN,160,NaN,NaN],
'Weight':[74,NaN,NaN,58,NaN,NaN],
'Gender':[NaN,'Male',NaN,NaN,'Female',NaN],
'Interests':[NaN,NaN,'Hiking,Sports',NaN,NaN,'Singing']}
df1 = pd.DataFrame(data)
df1
我想将同一日期的数据合并到一行中。 “日期”列采用时间戳格式。 最终输出应如下图所示。
非常感谢任何帮助。谢谢。
【问题讨论】:
-
我已经编辑了这个问题。大多数列都有 np.nan 值而不是空字符串。可能是这导致了错误。
-
@SeaBean 我尝试了您的更新解决方案。现在删除具有整数/数值的列。我想在数据框中拥有所有列而不删除任何列。我已经相应地更新了问题。
-
您修改后的数据根本无法运行。
160cm不加引号不是合法文本。你的意思是字符串吗?'160cm'而不是? -
其更新后的@SeaBean 160 是一个整数。其他是字符串
标签: python pandas dataframe data-science data-processing