【发布时间】:2018-10-12 10:28:09
【问题描述】:
我是python的初学者,在我的硕士论文中一直使用它来进行游戏行业的文本分析。我一直在尝试从几个游戏评论网站上搜集评论。
我在代码中使用了一个 URL 列表来抓取评论并取得了成功。不幸的是,我无法将每条评论写在单独的文件中。当我编写文件时,要么我只收到列表中最后一个 URL 对所有文件的评论,要么在更改缩进后收到所有文件中的所有评论。以下是我的代码。你能建议这里有什么问题吗?
from bs4 import BeautifulSoup
import requests
urls= ['http://www.playstationlifestyle.net/2018/05/08/ao-international-tennis-review/#/slide/1',
'http://www.playstationlifestyle.net/2018/03/27/atelier-lydie-and-suelle-review/#/slide/1',
'http://www.playstationlifestyle.net/2018/03/15/attack-on-titan-2-review-from-a-different-perspective-ps4/#/slide/1']
for url in urls:
r=requests.get(url).text
soup= BeautifulSoup(r, 'lxml')
for i in range(len(urls)):
file=open('filename%i.txt' %i, 'w')
for article_body in soup.find_all('p'):
body=article_body.text
file.write(body)
file.close()
【问题讨论】:
标签: python web-scraping beautifulsoup python-requests lxml