【发布时间】:2021-11-10 08:33:49
【问题描述】:
我正在使用 benedict python 库来解析.xml 文件(示例如下):
data_source = """
<?xml version="1.0" encoding="utf-8"?>
<RunInfo Version="5">
<Run Id="210910_A00154_0856_BH2TTNDMXY" Number="856">
<Date>9/10/2021 3:08:02 PM</Date>
</Run>
</RunInfo>"""
最终我要解析的是时间戳格式的时间,但没有日期,即只有3:08:02 PM
鉴于此
type(data['RunInfo']['Run']['Date']) 导致str
我做了pd.to_datetime(data['RunInfo']['Run']['Date'])
但日期在那里,原因很明显。
所以我只对要解析的部分(3:08:02 PM)进行切片,然后将其转换为时间戳格式,使用pd.to_datetime(data['RunInfo']['Run']['Date'][-10:], format="%H:%M:%S")
但是发生的事情是pd.to_dateTime() 仍然输出一个日期,现在是一个随机日期,这更糟。
有谁知道我如何只解析原始.xml 文件中的时间?
【问题讨论】:
标签: python-3.x pandas xml timestamp