【发布时间】:2013-07-10 14:55:25
【问题描述】:
我想使用 Python 来抓取网页上“您是否在寻找这些作者:”框的内容,例如:http://academic.research.microsoft.com/Search?query=lander
不幸的是,盒子的内容是由 JavaScript 动态加载的。通常在这种情况下,我可以阅读 Javascript 来了解发生了什么,或者我可以使用像 Firebug 这样的浏览器扩展来了解动态内容的来源。这次没有这样的运气...... Javascript 非常复杂,Firebug 没有提供很多关于如何获取内容的线索。
有什么技巧可以让这项任务变得简单吗?
【问题讨论】:
标签: python web-scraping screen-scraping