【发布时间】:2014-05-03 23:09:39
【问题描述】:
我正在使用 Nokogiri 解析 HTML 文档。此问题所基于的源代码表示形式如下:
<td width='400' valign=top>
<b><u>Jenny ID:</u> 8675309</b><br />
Name of Place<br />
Street Address<br />
City, State, Zip<br />
Contact: Jenny Jenny<br />
Phone: 867-5309<br />
Fax:
</td>
我使用几个分隔符来检索Jenny ID: 和Name of Place 之间的文本。使用#strip,我无法去掉前导空格。
> returned_value.inspect
=> " 8675309\r\n "
> returned_value.strip
=> " 8675309"
如果我使用测试字符串,#strip 确实会删除前导和尾随空格。
> test_string = " 11111 "
> test_tring.strip
=> "11111"
我怎样才能完全去掉这个领先的空间?我怀疑是&nbsp,但我无法摆脱它。
我保证我在现实生活中不会这么笨,但是这个问题让我很沮丧。真是无情。
谢谢!
【问题讨论】:
-
您尝试过“字符串”.chomp 吗? (它摆脱了 \n\r),然后你可以剥离它。所以:“”.chomp.strip
-
Chomp 不起作用。前导空格仍然存在。
-
你是怎么得到td的内容的?用text方法?
-
不漂亮但你可以使用
returned_value.strip[1..-1] -
好的,我现在明白了,感谢和抱歉造成的误解
标签: ruby-on-rails ruby html-parsing nokogiri