【发布时间】:2012-12-16 22:51:01
【问题描述】:
我这里有一个网站
这里列出了大约 100 家公司。 如何使用 Python(或 C#)以编程方式保存接下来的 100 家公司。 在本页底部
显示 1 - 100 个,共 528 个 >
被看到了。如何访问链接
下一步>>
以编程方式。此链接被视为基本 url + '#'(http://money.rediff.com/indices/bse/bsesmallcap#)。 如何保存所有 1-528 公司详细信息(作为单独的网页:1-100,101-200 等)。 有没有专门为这类任务量身定制的程序。
【问题讨论】:
-
如果您正在寻找一个好的答案,您可能想让您的问题更具体 - 这是谷歌绝对可以帮助解决的问题。另外,请查看 scrapy 或 BeautifulSoup
标签: python ajax web-scraping