【发布时间】:2016-03-24 00:19:02
【问题描述】:
我是正则表达式的新手,还在学习。
我有一个 XML 文件,其中有一个文本节点,后面是临床信息。
在文本节点中,我定义了类似的内容 ID
<item>
<content ID="a138134600007">Wellbutrin TABS;</content>
<content ID="a138134600007-sta"> (Active) </content>
<content ID="a138134600007-comments"> </content>
</item>
稍后在包含实际临床数据的较低 xml sn-p 中引用这些 id
<text>
<reference value="#al38134600007" />
</text>
我想用 id 表示的内容替换上面的文本节点,所以我想将文件转换为如下所示
<text>
Wellbutrin TABS;
</text>
作为一名 Java 开发人员,我拒绝编写一个非常丑陋的解决方案并寻找一个更优雅的正则表达式解决方案(更不用说性能,因为转换需要在半百万个 xml CCD 中发生)。
我想用 perl 来做,因为它在 linux 上默认可用,但很高兴使用任何可以解决这个问题的技术。
有什么建议吗?
提前致谢, 干杯, 维平。
【问题讨论】:
-
解析 XML 时,优雅的解决方案通常是不使用正则表达式 :-) stackoverflow.com/questions/701166/…
-
用文本解析 xml 不是一个好主意,他们有 xml 解析器
-
我们无法针对 GIF 测试可能的解决方案。包括一个小的、完整的、可测试的示例输入和预期输出示例。
-
请不要发布代码图片的链接;只需发布代码,特别是因为它很少。你能相应地编辑你的问题吗?
-
“作为一名 Java 开发人员,我拒绝编写一个非常丑陋的解决方案” 我不同意这两者有任何关联
标签: regex perl awk sed regex-lookarounds