【发布时间】:2011-04-09 09:59:05
【问题描述】:
我有一个网址列表,我想将其刮成 *.txt 格式。任何人都可以向我建议如何编写一个集成正则表达式的 php 代码并将所有 html 表从列出的 url 中抓取到一个 excel 文件中。我曾尝试手动执行此操作,但由于网址数量众多,因此花费了我很多时间。
对于手动抓取,我已将 html 代码复制到记事本并保存为 html 文件并将文件拖放到 excel 中,从而为我提供了我想要的 excel 文件。
请发送您的回复并提供正确的代码。
【问题讨论】:
-
网上有很多资源可以指导您执行此操作。如果您在实现代码时遇到问题,请在此处发布。这不是一个代码编写网站。
-
谢谢,但正如我所说,我遇到了麻烦,因为我需要处理很多网址。因此,如果有人可以建议我将 html 代码复制到记事本的代码,那么它很可能是我的解决方案。
-
你已经尝试过什么?您的尝试与您想要的结果有何不同?正如 Fareesh 所说,我们不会建议或给您任何代码。
-
这是一个 let-all-parse-html 星期六吗?哈哈这是我今天看到的第四个问题xD
标签: php html regex web-crawler export-to-excel