【发布时间】:2019-03-28 20:41:21
【问题描述】:
有人可以帮忙将以下 XML 文件转换为 Pandas 数据框吗:
<?xml version="1.0" encoding="UTF-8" ?>
<root>
<bathrooms type="dict">
<n35237 type="number">1.0</n35237>
<n32238 type="number">3.0</n32238>
<n44699 type="number">nan</n44699>
</bathrooms>
<price type="dict">
<n35237 type="number">7020000.0</n35237>
<n32238 type="number">10000000.0</n32238>
<n44699 type="number">4128000.0</n44699>
</price>
<property_id type="dict">
<n35237 type="number">35237.0</n35237>
<n32238 type="number">32238.0</n32238>
<n44699 type="number">44699.0</n44699>
</property_id>
</root>
应该是这样的——
这是我写的代码:-
import pandas as pd
import xml.etree.ElementTree as ET
tree = ET.parse('real_state.xml')
root = tree.getroot()
dfcols = ['property_id', 'price', 'bathrooms']
df_xml = pd.DataFrame(columns=dfcols)
for node in root:
property_id = node.attrib.get('property_id')
price = node.attrib.get('price')
bathrooms = node.attrib.get('bathrooms')
df_xml = df_xml.append(
pd.Series([property_id, price, bathrooms], index=dfcols),
ignore_index=True)
print(df_xml)
我到处都得到 None,而不是实际值。有人可以告诉它如何修复。谢谢!
【问题讨论】:
-
如果我可以让问题更清楚,请发布您的 cmets..
-
您可以先发布 XML 代码而不是图像。
-
你是通过请求获取数据还是xml文件?
-
这是一个 XML 文件。
标签: pandas elementtree