【发布时间】:2015-12-29 23:40:32
【问题描述】:
我在从网站提取数据时遇到问题。 我正在尝试获取公司名称并为其定价:SYGNITY 和 8,40
<a class="link" href="http://www.money.pl/gielda/spolki-gpw/PLCMPLD00016.html">SYGNITY</a>
</td>
<td class="ac"><a href="javascript: OO('SGN','2015-10-01')"><img width="12" height="11" src="http://static1.money.pl/i/gielda/chart.gif" title="Pokaż wykres" alt="Pokaż wykres" /></a></td>
<td class="al">SGN</td>
<td class="ar">8,40</td>
我尝试使用这种模式,但它不起作用:
String expr = "<a class=\"link\" href=\"(.+?)\">(.+?)</a>(.+?)<td class=\"ar\">(.+?)</td> ";
有什么建议吗?
【问题讨论】:
-
不要使用正则表达式来解析 HTML,使用适当的 HTML 解析器,例如 JSoup。
-
网站上投票率最高的答案之一 - stackoverflow.com/a/1732454/1541619
标签: java regex expression