【发布时间】:2014-10-03 08:40:12
【问题描述】:
在Safari浏览器中,我可以右键选择“Inspect Element”,出现很多代码。是否可以使用 Python 获取此代码?最好的解决方案是获取一个包含代码的文件。
更具体地说,我正在尝试在此页面上找到指向图像的链接:http://500px.com/popular。我可以看到“检查元素”中的链接,我想用 Python 检索它们。
【问题讨论】:
-
您在检查元素中看到的代码是页面源代码,即浏览器获取并转换为可视网站的文本。 chrome的inspect元素为开发人员提供了很多功能,但它的核心仍然只是源代码。当然,您可以使用 python 获取该信息-但您的问题非常笼统-您是要抓取整个网站,单个页面还是要获取其中的特定部分?该页面的样式表呢?
-
我正在尝试在此页面上找到指向图像的链接:500px.com/popular。我可以看到“检查元素”中的链接,并用 Python 检索它们。
-
看到了吗?这是一个完全不同的问题!获取网页的源代码需要两行代码:
import urllib; urllib.urlopen("http://500px.com/popular").read();。它正在分析通常是复杂部分的html。建议你learn a bit about scraping,开始熟悉python抓取库(如BeautifulSoup) -
哦,看,500px 有一个 API。所以如果你很懒,还有一个ready-made python client。
-
我试过了,但链接不存在。那么从“检查元素”获取代码不是一个简单的方法吗?
标签: python web mechanize inspect-element