【发布时间】:2017-04-03 01:44:42
【问题描述】:
我正在尝试从网址中抓取 stockcharts.com 以获取图表图像。例如来自:http://stockcharts.com/h-sc/ui?s=AMZN
但是,当检查有问题的元素时,它不是带有 .jpg、.png 等后缀的正确图像 src。例如上面链接中的问题元素是:http://stockcharts.com/c-sc/sc?s=AMZN&p=D&b=5&g=0&i=0&r=1479451634864
因此,当我尝试在 python 2.7 中使用以下代码时,我在共享脚本的目录中得到一个空文件:
import urllib
url = "http://stockcharts.com/c-sc/sc?s=AMZN&p=D&b=5&g=0&i=0&r=1479451634864"
filename = "testimg.jpg"
urllib.urlretrieve(url, filename)
这是一个 javascript 呈现的页面,还是我遗漏了什么?参考其他地方?
【问题讨论】:
标签: python web-scraping urllib