【问题标题】:xml to R Attributesxml 到 R 属性
【发布时间】:2017-02-17 14:35:54
【问题描述】:

从 xml 提取属性到 R 时遇到问题。我的 xml 文件如下:

- <export>
  + <ExportRef>
  - <BookNodes>
      - <Book label="romance">
        + <Showing>
        - <Data>
             + <Char1 label="Char1">
             - <Char2 label="Char2">
                   + <SubChar21>
                   - <SubChar22>
                        <Range unit="nm">4</Range>
                        <Range unit="nm">8</Range>
                     </SubChar22>
             - <Char3 label="Char3">
                   + <SubChar31>
                   - <SubChar32>
                        <Range Id="1">voc</Range>
                        <Range Id="2">buc</Range>
                     </SubChar32>
          </Data>
      </Book>
      - <Book label="horror">
        + <Showing>
        - <Data>
             + <Char1 label="Char1">
             - <Char2 label="Char2">
                   + <SubChar21>
                   - <SubChar22>
                        <Range unit="nm">4</Range>
                        <Range unit="nm">8</Range>
                     </SubChar22>
             - <Char3 label="Char3">
                   + <SubChar31>
                   - <SubChar32>
                        <Range Id="1">voc</Range>
                        <Range Id="2">buc</Range>
                     </SubChar32>
          </Data>
      </Book>
    </BookNodes>
 </export>

我想要一个仅针对每个图书类别的 Range Id 列表。例如:

浪漫:

id id
1  2

恐怖:

id id
1  2

当我这样做时:

RangeID_1<-xpathSApply(AC_Node[[1]][[2]], ".//Range", xmlAttrs)

我明白了:

unit unit  id  id
"nm"  "nm" "1"  "2"

如何对 R 说我只想要 Range Id 而不是 Range 单位?

非常感谢!!

【问题讨论】:

  • 这不是 XML 文件。这是来自允许节点扩展的 XML 查看器的 XML 文件的文本副本。没有人会为您编辑该块以使其成为合法的 XML。
  • 另外请提供最少但完整的可重现代码,包括所有库语句和输入文件的代码。

标签: r wml


【解决方案1】:

我的两分钱 rvest:

library(rvest)
read_xml("your_xml_file.xml") %>% 
  xml_nodes("Range") %>% 
  xml_attr("Id")

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2013-09-02
    • 1970-01-01
    • 2023-04-07
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2018-09-15
    相关资源
    最近更新 更多