【问题标题】:How to hide my IP doing web scraping in python?如何隐藏我的 IP 在 python 中进行网络抓取?
【发布时间】:2020-05-21 15:53:51
【问题描述】:

我在某些页面中使用 python 进行网页抓取,但我已被其中一些页面阻止。当我尝试通过 TOR 浏览器检查它时,我发现我也无法访问这些页面,所以我认为这些页面已经能够跟踪我所有的 IP,或者我没有配置好 TOR(我认为不是因为我用 Chrome 和 TOR 检查了我的 IP 地址并且不同),所以,有人知道为什么吗?

另外,我正在尝试在我的 python 代码中执行一个函数或方法来自动更改 mi IP。我所看到的是最好的方法是通过 TOR 浏览器(使用它作为搜索引擎从页面获取数据)来完成,但我无法让它工作。你对创建这个函数有什么建议吗?

谢谢!

【问题讨论】:

  • 使用代理服务器,google一下

标签: python web-scraping ip tor


【解决方案1】:

我希望防刮保护也能阻止来自已知 Tor 出口节点的访问。我不认为他们知道是你。一些网站雇用/实施最先进的刮擦保护服务。

您可以在朋友和家人处设置自己的代理,并使用非常保守的抓取速度,或者搜索商业住宅代理产品。

【讨论】:

  • 感谢您的回复尼尔斯。我最后做的是在请求访问网页时更改用户代理。看来它正在工作。不知道还有多少时间……
猜你喜欢
  • 2018-03-20
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2020-04-18
  • 2020-08-25
  • 1970-01-01
  • 2017-12-30
  • 2020-05-11
相关资源
最近更新 更多