【发布时间】:2013-01-03 17:38:42
【问题描述】:
我正在做一些研究 我想抓取 youtube 视频链接(然后获取视频 ID)
例如,如果我在 youtube 搜索栏输入关键字“obama” 然后 youtube.com 将返回结果页面
http://www.youtube.com/results?search_query=htc&page=2 将页面向下滚动到底部 我们可以看到页码 1 2 3 4 5 6 7 点击页码从 2 到 3 到 4 到 5.... 那么我们可以达到最大页码:50
所以我想下载从 1 到 50 的所有页面 有一个url技巧,比如
http://www.youtube.com/results?search_query=obama&page=5
但是,如果我使用 wget 下载每个页面,有时会阻止下载 或者有时候,当页码很大时,返回的页面不是异常页面。
所以正确的方法是手动单击页码按钮并使用网络浏览器下载每个页面,是否可以自动化手动程序? 我在互联网上搜索,一些人提到了 chrome javascript 扩展, 无论如何,有没有办法编写一些自动化脚本来模仿手动操作?谢谢!
【问题讨论】:
标签: javascript google-chrome web-crawler