【发布时间】:2019-06-09 18:52:16
【问题描述】:
目的:从div类list_area daily_all中抓取文本数据。
使用scrapy shell,我首先“抓取”了我想从中抓取数据的网站: https://comic.naver.com/webtoon/weekday.nhn
使用“scrapy shell”脚本:
scrapy shell 'https://comic.naver.com/webtoon/weekday.nhn'
使用 xpath,我想从 div 类“list_area daily_all”中抓取所有文本数据:
response.xpath("//div[@id='wrap']/div[@id='container']/div[@class='list_area daily_all']/text()")
但是,上面的代码没有返回任何内容。 我做错了什么?
【问题讨论】:
标签: python scrapy web-crawler screen-scraping