【发布时间】:2015-12-06 20:32:00
【问题描述】:
我想用 Python 处理特定标签之间的 .tcx 文件(xml 形式)中的数据。
文件格式如下。
<Track>
<Trackpoint>
<Time>2015-08-29T22:04:39.000Z</Time>
<Position>
<LatitudeDegrees>37.198049426078796</LatitudeDegrees>
<LongitudeDegrees>127.07204628735781</LongitudeDegrees>
</Position>
<AltitudeMeters>34.79999923706055</AltitudeMeters>
<DistanceMeters>7.309999942779541</DistanceMeters>
<HeartRateBpm>
<Value>102</Value>
</HeartRateBpm>
<Cadence>76</Cadence>
<Extensions>
<TPX xmlns="http://www.garmin.com/xmlschemas/ActivityExtension/v2">
<Watts>112</Watts>
</TPX>
</Extensions>
</Trackpoint>
....Lots of <Trackpoint> ... </Trackpoint>
</Track>
最终,我将制作包含“纬度、海拔、...瓦特”列的数据表。
首先,我尝试使用 BeautifulSoup、xpath 等从标记数据(如 Watts ... /Watts)中创建一个列表。
但我是处理这些工具的新手。
如何使用 Python 在 xml 文件中的标签之间抓取数据?
【问题讨论】:
标签: python xml parsing xpath beautifulsoup