【发布时间】:2020-09-27 12:45:21
【问题描述】:
我有一个这样排列的庞大数据集。每个 ID 对应一组唯一的组。
0
0 0
NUMBER 22 ADD_FLD 5 15 &11111
ID 382 START_TIME 2001052306
POINT 63
2010052306 119.464119 15.870264 1.682708e+00 & 1.213053
2010052312 119.910667 15.874892 1.934127e+00 & 1.221175
2010052318 120.368523 16.022879 2.260490e+00 & 1.227459
2010052400 120.611115 15.788021 2.787007e+00 & 1.229084
2010052406 121.286072 15.984570 3.253321e+00 & 1.230381
ID 413 START_TIME 2010061006
POINT 40
2010061006 156.424057 5.559299 1.059667e+00 & 1.578506
2010061012 153.899506 6.450210 1.150635e+00 & 1.516614
2010061018 152.346802 7.281753 1.187466e+00 & 1.501871
我想做的是将它们重新排列成这样。
ID YR MONTH DAY HR LON LAT RESULT1 RESULT2
382 2010 05 23 06 119.464119 15.870264 1.682708e+00 1.213053
382 2010 05 23 12 119.910667 15.874892 1.934127e+00 1.221175
382 2010 05 23 18 120.368523 16.022879 2.260490e+00 1.227459
382 2010 05 24 00 120.611115 15.788021 2.787007e+00 1.229084
382 2010 05 24 06 121.286072 15.984570 3.253321e+00 1.230381
413 2010 06 10 06 156.424057 5.559299 1.059667e+00 1.578506
413 2010 06 10 12 153.899506 6.450210 1.150635e+00 1.516614
413 2010 06 10 18 152.346802 7.281753 1.187466e+00 1.501871
ID 列基于为每个组分配的相应唯一 ID。 YR、MONTH、DAY 和 HR 基于输入的第一列。
如果有任何帮助,我将不胜感激。谢谢
【问题讨论】:
-
您能详细说明一下吗?您如何到达输出的列并不明显。如果可能,展示一个更简单的可重现的最小示例可能会有所帮助。
标签: python python-3.x pandas csv