【发布时间】:2017-07-29 21:33:07
【问题描述】:
所以,我现在正在研究 Python,因为我很久以前研究过它,并没有深入学习这些语言,现在,我正在再次研究它。
我现在正在研究的是网络爬虫,但我不确定这是否正确,我认为我应该正在研究这个项目。如果我错了,请纠正我,但这里是我正在考虑的项目
我想编写一个程序,我可以在其中简单地启动它,然后输入一个网站 url(特定的或完整的网站),它会扫描它以查找 Embed/iFrame 代码,并将链接下载到一个表中如:
- 页面标题 - | -# of iFrame 的 Found- | -嵌入1- -/嵌入1- | -Embed2- -/Embed2- 等等。
我是在寻找正确的语言和方面,还是应该为此寻找其他东西?
提前感谢您的任何反馈/支持!
【问题讨论】:
-
scrapy 是您正在寻找的。span>