【发布时间】:2013-03-30 15:13:57
【问题描述】:
我正在使用 Selenium 尝试从网站获取数据。但是我想要的数据存储在“隐藏”标签中,所以当我拉出源时它是不可见的。有没有办法解决这个问题?有不同类型的隐藏吗?
我认为它是隐藏的,因为我也在使用 Firebug,它可以在我试图抓取的页面上看到源代码,但它“灰色”掉了那个源,我读过这表明源被 style:hidden 标签隐藏。
【问题讨论】:
-
您是否可以使用 urllib2 或类似方法提取 HTML?如果是这样,在那里寻找它,也许你可以用 Beautiful Soup 处理它以获得隐藏的标签。
-
我可以提取它,但是其中缺少大量内容。它只是不存在。
-
你能提供你感兴趣的网站的网址吗?
-
我会给出网址,但需要登录才能看到。对不起。
标签: python css web-scraping web-crawler