【发布时间】:2015-05-19 03:15:00
【问题描述】:
我正在编写一个网络爬虫程序来从雅虎财经、谷歌财经或纳斯达克提取股票报价。我可以获取包含股票价格的 html 元素,但我只需要结果中的美元值。例如,示例输出如下图所示:
我在这里使用了一张图片,因为当我发布实际的 html 时,只显示了美元金额(所需的结果),html 实体和标签消失了。 这是我的代码 我对 regEx 不是很熟悉,但我试过但没有运气。如何从输出中仅提取美元金额?
【问题讨论】:
-
如果你在解析 HTML,为什么不使用 JSoup 之类的解析器呢?
标签: java html regex web-scraping data-processing