【发布时间】:2012-05-18 09:26:54
【问题描述】:
大家好!使用 firefox 插件,我可以捕获标题。我想在 python 中执行此操作:我需要将浏览器代理设置更改为 localhost:8080 (或任何端口),然后浏览器发出的每个请求都应该通过实际运行在我的机器上的 python 脚本。该脚本应该能够捕获标题,捕获网页中的链接等。我知道 Web 应用程序扫描仪会这样做,但我怎么能在 python 中做到这一点。你能建议任何开始的地方,阅读吗?我只是想了解它并实施一个。
【问题讨论】:
-
去年我用python做了一个简单的代理,但是我找不到我把脚本放在哪里:(。无论如何,实现http部分很容易,但支持https(通过CONNECT方法)是相当困难。我从来没有足够的动力去实现它。
标签: python localhost web-crawler proxy-server