【发布时间】:2018-12-26 23:10:22
【问题描述】:
我需要对特定网站进行网页抓取,但它不允许网页抓取(403 错误)。我正在考虑复制我需要的网站的 html 数据并将其放入 txt 文档中,在那里我可以像网页一样抓取它。这是可能的还是有更好的方法来解决这个问题?
【问题讨论】:
-
您确定您可以访问该网站吗?请尝试从浏览器中查看
-
为了将来参考,您应该包含有关您搜索过的内容和/或您已经尝试过的内容的信息。
标签: python html web-scraping