【发布时间】:2021-11-06 11:18:06
【问题描述】:
我有几个 csv 文件,一个用于患者血压,另一个用于心率、WBc 等,用于同一患者和同一小时测量,请参阅以下示例
第一个 csv:
subject_id hour_id value label
1 1 96 blood pressure
1 1 94 blood pressure
1 1 93 blood pressure
2 2 99 blood pressure
第二个 csv:
subject_id hour_id value label
1 1 80 Heart rate
2 2 89 Heart rate
2 2 81 Heart rate
第三个csv:
subject_id hour_id value label
1 1 1 WBC
2 2 10 WBC
2 2 12 WBC
第四个 csv:
subject_id hour_id value label
1 1 123 glucose
2 2 111 glucose
2 2 113 glucose
期望的输出:
subject_id hour_id blood_pressure heart rate WBC gloucose
1 1 96 80 1 123
2 2 99 89 10 120
我试过了:
df = pd.read_csv('D:\\....', low_memory=False, error_bad_lines=False)
df2 = pd.read_csv('D:\\Users', low_memory=False, error_bad_lines=False)
merged = pd.concat([df, df2,df3,df4], axis=1, keys=['subject_id', 'hour_mesaure'])
print(merged)
但它给了我:
subject_id hour_id blood_pressure
1 1 96
2 2 99
subject_id hour_id value label
1 1 80 Heart rate
2 2 89 Heart rate
并按顺序完成文件
任何帮助将不胜感激
【问题讨论】:
-
为什么选择 python 2.7 和 python 3.x - 你有计划在 python 2.7 上运行代码吗?
-
不只是想让所有对python感兴趣的人都能看到
-
2.7 不应使用,除非您有充分的理由使用它。我将删除此标签。
-
我认为它已经被删除了
-
它是(由我 :-))
标签: python python-3.x csv