【发布时间】:2009-04-30 21:32:11
【问题描述】:
我正在编写一个 curl 脚本来收集有关一些性犯罪者的信息,我已经开发了一个脚本来获取如下所示的链接:
http://criminaljustice.state.ny.us/cgi/internet/nsor/...(截断网址)
现在,当我们打开此链接时,我想在此页面上的所有字段下获取信息,例如罪犯 ID:、姓氏等,并将其放入我自己的变量中。我的正则表达式很弱,这就是我在这里的原因。还是有别的办法?
有人可以帮我做吗?
【问题讨论】:
标签: php regex screen-scraping