【发布时间】:2019-02-03 11:49:47
【问题描述】:
如果我们有一个带有 Car_Info 列的 pandas 数据框 df1。
我们如何将以下字符串中的信息提取到新列中?即使用正则表达式与 pd.read_json()?
请注意“car_id”和“wheel_id”的格式与“price”和“count_results”的格式略有不同。
Car_Info
'{"car_id":"100","wheel_id":"80-ABC-999","price":14,"count_results":1051}'
'{"car_id":"200","wheel_id":"90-XY-6134","price":245,"count_results":37}'
'{"car_id":"300","wheel_id":"100-QRST-83751","price":729,"count_results":203}'
更具体地说,我们如何操作 Car_Info 列以将以下四列添加到 pandas 数据框 df1?
car_id
100
200
300
wheel_id
80-ABC-999
90-XY-6134
100-QRST-83751
price
14
245
729
count_results
1051
37
203
【问题讨论】:
-
您的输入是 JSON。请标记 [json]。将 JSON 读入 pandas 有很多重复。
-
如何将 JSON 列转换为字典并提取 car_id、wheel_id、price 和 count_results 的结果?
-
我看到你在 2 小时后将其交叉发布为 https://stackoverflow.com/questions/52066019/using-regex-to-extract-information-from-a-pandas-dataframe-column,这是不受欢迎的。此外,您没有将其表述为“使用正则表达式将 JSON 解析为熊猫”。