【发布时间】:2010-07-27 18:41:47
【问题描述】:
这是 xml 文件的示例
<row tnote="0">
<entry namest="col2" nameend="col4" us="none" emph="bld"><blst>
<li><text>Single, head of household, or qualifying widow(er)—$55,000</text></li>
<li><text>Married filing jointly—$115,000</text></li>
</blst></entry>
<entry colname="col6" ldr="1" valign="middle"> </entry>
<entry colname="col7" valign="middle"> 5.</entry>
</row>
&#x2014; 等代表 HTML 4.0 实体。我想将每一行的文本存储为数组的一个元素,但如果该行只是&#x2002;
if e.text.strip =~ /^ [0-9][0-9];$/ then
next
else
subLines << e.text
end
但它似乎不起作用...我的正则表达式不正确吗?
【问题讨论】:
-
这段代码是什么语言的?
strip是做什么的? -
不,字符引用不代表实体。反过来说:实体用于表示字符引用。
&mdash;是一个实体引用,名为 mdash 的实体表示值&#8212;(参见 w3.org/TR/html4/sgml/entities.html#h-24.2.1)。所以实体引用&mdash;引用了字符引用&#8212;,它引用了 Unicode 字符 U+2014。 -
@Gumbo:
U+nnnn表示法使用十六进制数字,而不是十进制:U+2014 -
@Alan Moore:是的,当然可以。