从另一个网站抓取表格答案

【问题标题】：scraping table from another website从另一个网站抓取表格
【发布时间】：2013-05-20 12:43:46
【问题描述】：

由于没有 TR 类等，我如何使用 SIMPLE DOM HTML 抓取此表？

<table width='100%' border='0' cellspacing='0' cellpadding='0' id='cashRatesTable'>
<tr class='tableHeader'>
<td>Currency</td>
<td>Equal to £1 GBP</td>
<td>Order Online<td>
</tr>
<tr>
<td>Euros</td><td>1.1603</td><td><a href='order-travel-money/buy-euro.aspx'>Order Euros online</a></td></tr>
<tr>
<td>US Dollars</td><td>1.4909</td><td><a href='order-travel-money/buy-dollar.aspx'>Order US Dollars online</a></td></tr>
<tr>
<td>United Arab Emirates, Dirhams</td><td>5.4267</td><td><a href='order-travel-money/buy-UAE-dirham.aspx'>Order UAE Dirhams online</a></td>
</tr>
</table>

【问题讨论】：

我需要数组中的数据而不是整体
你试过什么？这种尝试以什么方式不起作用？我想任何 HTML 解析器都可以解析它，除非它有什么我没有注意到的严重错误。

标签： parsing screen-scraping

【解决方案1】：

你的问题有点含糊。您可以使用您喜欢的语言并使用例如正则表达式。它们使用所有语言。如果以上只是您需要的示例并且您需要完成大量抓取，那么有许多可用的工具，我个人使用 Netscavator (http://www.netscavator.com/)，但还有其他工具。这个的聪明之处在于它可以免费供私人使用。

【讨论】：