【问题标题】:XML to DateFrame PythonXML 到 DataFrame Python
【发布时间】:2020-07-08 04:09:31
【问题描述】:

我在 Python 中将 xml 解析为 Pandas DF 时遇到问题。我无法从 XML 文件中获取数据。

我想读取这个 XML 文件并将其转换为 DF

NIP Name Sell ID contractor ID contractor Name contractor Adress Documents ID Date K_23 K_24

请帮忙

<?xml version="1.0" encoding="utf-8"?>
<JPK xmlns="http://jpk.mf.gov.pl/wzor/2017/11/13/1113/" xmlns:etd="http://crd.gov.pl/xml/schematy/dziedzinowe/mf/2016/01/25/eD/DefinicjeTypy/" xmlns:xsi="http://www.w3.org/2001/XMLSchema-instance" xsi:schemaLocation="http://jpk.mf.gov.pl/wzor/2017/11/13/1113/ https://www.gov.pl/documents/2034621/2182793/Schemat_JPK_VAT(3)_v1-1.xsd/ab0741d5-fa6d-9596-b089-6778ea5df160">
  <Head>
    <ID="zzzzzzz" versionSchemy="1-1">zzzzzz</ID>
    <Tarfet>1</Targer>
    <CreateDate>2020-01-21T09:51:58</CreateDate>
    <Datefrom>2019-11-01</Datefrom>
    <DateTo>2019-11-30</DateTo>
    <System>xxxxx</System>
  </Head>
  <Client>
    <NIP>xxxxxxxx</NIP>
    <Name>xxxxxx</Name>
  </Client>
  <Sell>
    <Sell ID>1</Sell ID>
    <contractor ID >xxxxxxx</contractor ID>
    <contractor Name>xxxxxxx"</contractor Name>
    <contractor Adress>xxxxxxxxx</contractor Adress>
    <Documents ID >xxxxxxxxxx</Documents ID >
    <Date>2019-11-01</Date>
    <K_23>31532513.17</K_23>
    <K_24>5324.05</K_24>
  </Sell>
  <Sell>
    <Sell ID>2</Sell ID>
    <contractor ID >yyyy</contractor ID>
    <contractor Name>yyyyy"</contractor Name>
    <contractor Adress>yyyyyyy</contractor Adress>
    <Documents ID >yyyyyyyyy</Documents ID >
    <Date>2019-11-05</Date>
    <K_23>312513.17</K_23>
    <K_24>5532.05</K_24>

【问题讨论】:

标签: python xml pandas lxml


【解决方案1】:

使用 xmltodict:

import xmltodict

with open(file_name, 'rb') as f:
     data = xmltodict.parse(f.read())

data 将是一个orderedDict,你可以从中提取你想要的数据。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2018-11-19
    • 2018-04-30
    • 2021-04-04
    • 1970-01-01
    • 2017-07-26
    • 2019-07-31
    • 1970-01-01
    • 2016-06-13
    相关资源
    最近更新 更多