【发布时间】:2018-04-26 08:08:52
【问题描述】:
我正在使用我在 Github 上找到的这个亚马逊评论抓取工具:https://github.com/philipperemy/amazon-reviews-scraper
for review in reviews_list:
rating = review.find(attrs={'data-hook': 'review-star-rating'}).attrs['class'][2].split('-')[-1]
body = review.find(attrs={'data-hook': 'review-body'}).text
date = review.find(attrs={'data-hook': 'review-date'}).text
title = review.find(attrs={'data-hook': 'review-title'}).text
logging.info('***********************************************')
logging.info(title)
logging.info(date)
logging.info(rating)
logging.info(body)
logging.info('***********************************************\n')
reviews.append({'title': title,
'rating': rating,
'body': body,
'product_id': product_id
})
return reviews
我希望将这些结果发送到 CSV 文件。但我只是 Python 的初学者,所以我不完全确定。我在 Windows 上使用 Python。
在 Akshat 的帮助下,我得到了这个,但我不确定它是否正确:
for review in reviews_list:
rating = review.find(attrs={'data-hook': 'review-star-rating'}).attrs['class'][2].split('-')[-1]
body = review.find(attrs={'data-hook': 'review-body'}).text
date = review.find(attrs={'data-hook': 'review-date'}).text
title = review.find(attrs={'data-hook': 'review-title'}).text
from csv import DictWriter
with open('results.csv', 'w') as csvfile:
fieldnames = ['title', 'date', 'rating', 'body']
writer = csv.DictWriter(csvfile, fieldnames=fieldnames)
writer.writeheader()
for review in reviews:
writer.writerow(review)
【问题讨论】:
-
附加说明 - SO 不是免费的编码服务 - 你必须得到帮助 - 尽你所能尝试一些事情 - 然后在你的代码中出现问题以寻求帮助
-
确实如此。我更新了我的帖子以反映它。从昨天开始,我一直在尝试任何事情,但真的一无所获。
标签: python csv web-scraping