【问题标题】:scraping table from another website从另一个网站抓取表格
【发布时间】:2013-05-20 12:43:46
【问题描述】:

由于没有 TR 类等,我如何使用 SIMPLE DOM HTML 抓取此表?

<table width='100%' border='0' cellspacing='0' cellpadding='0' id='cashRatesTable'>
<tr class='tableHeader'>
<td>Currency</td>
<td>Equal to £1 GBP</td>
<td>Order Online<td>
</tr>
<tr>
<td>Euros</td><td>1.1603</td><td><a href='order-travel-money/buy-euro.aspx'>Order Euros online</a></td></tr>
<tr>
<td>US Dollars</td><td>1.4909</td><td><a href='order-travel-money/buy-dollar.aspx'>Order US Dollars online</a></td></tr>
<tr>
<td>United Arab Emirates, Dirhams</td><td>5.4267</td><td><a href='order-travel-money/buy-UAE-dirham.aspx'>Order UAE Dirhams online</a></td>
</tr>
</table>    

【问题讨论】:

  • 我需要数组中的数据而不是整体
  • 你试过什么?这种尝试以什么方式不起作用?我想任何 HTML 解析器都可以解析它,除非它有什么我没有注意到的严重错误。

标签: parsing screen-scraping


【解决方案1】:

你的问题有点含糊。您可以使用您喜欢的语言并使用例如正则表达式。它们使用所有语言。如果以上只是您需要的示例并且您需要完成大量抓取,那么有许多可用的工具,我个人使用 Netscavator (http://www.netscavator.com/),但还有其他工具。这个的聪明之处在于它可以免费供私人使用。

【讨论】:

    猜你喜欢
    • 2021-07-01
    • 2019-01-16
    • 1970-01-01
    • 2017-10-16
    • 2011-03-12
    • 1970-01-01
    • 1970-01-01
    • 2022-07-10
    • 2018-10-13
    相关资源
    最近更新 更多