【发布时间】:2014-09-27 19:45:19
【问题描述】:
我是网络抓取初学者。 我首先参考https://www.youtube.com/watch?v=ZAUNEEtzsrg下载带有特定标签的图像(例如cat),它可以工作! 但是我遇到了只能下载大约100张图片的新问题,这个问题看起来像“ajax”,它只加载第一页html而不加载所有。因此,我们似乎必须模拟向下滚动才能下载接下来的 100 张或更多图片。
我的代码:https://drive.google.com/file/d/0Bwjk-LKe_AohNk9CNXVQbGRxMHc/edit?usp=sharing
总结起来,问题如下:
如何通过python中的源代码下载谷歌图片搜索中的所有图片(请给我一些例子:))
有什么我必须知道的网络抓取技术吗?
【问题讨论】:
-
您找到解决方案了吗?我至少应该下载 500 张图片,我也有同样的问题。似乎所有的抓取方法和google api都无法下载超过100张图片。
-
@Ozg,还没有……,太难了。如果您有解决方案,请与我分享,谢谢。
-
嘿@RyanLiu 你有什么解决办法吗?
标签: python ajax web-scraping web-crawler google-image-search