【发布时间】:2017-02-17 14:35:54
【问题描述】:
从 xml 提取属性到 R 时遇到问题。我的 xml 文件如下:
- <export>
+ <ExportRef>
- <BookNodes>
- <Book label="romance">
+ <Showing>
- <Data>
+ <Char1 label="Char1">
- <Char2 label="Char2">
+ <SubChar21>
- <SubChar22>
<Range unit="nm">4</Range>
<Range unit="nm">8</Range>
</SubChar22>
- <Char3 label="Char3">
+ <SubChar31>
- <SubChar32>
<Range Id="1">voc</Range>
<Range Id="2">buc</Range>
</SubChar32>
</Data>
</Book>
- <Book label="horror">
+ <Showing>
- <Data>
+ <Char1 label="Char1">
- <Char2 label="Char2">
+ <SubChar21>
- <SubChar22>
<Range unit="nm">4</Range>
<Range unit="nm">8</Range>
</SubChar22>
- <Char3 label="Char3">
+ <SubChar31>
- <SubChar32>
<Range Id="1">voc</Range>
<Range Id="2">buc</Range>
</SubChar32>
</Data>
</Book>
</BookNodes>
</export>
我想要一个仅针对每个图书类别的 Range Id 列表。例如:
浪漫:
id id
1 2
恐怖:
id id
1 2
当我这样做时:
RangeID_1<-xpathSApply(AC_Node[[1]][[2]], ".//Range", xmlAttrs)
我明白了:
unit unit id id
"nm" "nm" "1" "2"
如何对 R 说我只想要 Range Id 而不是 Range 单位?
非常感谢!!
【问题讨论】:
-
这不是 XML 文件。这是来自允许节点扩展的 XML 查看器的 XML 文件的文本副本。没有人会为您编辑该块以使其成为合法的 XML。
-
另外请提供最少但完整的可重现代码,包括所有库语句和输入文件的代码。