【发布时间】:2019-09-21 12:45:50
【问题描述】:
我正在编写一个程序,它分析在线评论并根据评分将评论存储到review_text,并将相应的评分存储到review_label,作为正面(4 星和 5 星)或负面(1、2 和 3)星)。
尝试了以下代码添加每条评论的评论文本和评论标签信息,但没有成功。
rev = ['review_text', 'review_label']
for file in restaurant_urls:
url_rev= file
html_r_r=requests.get(url_rev).text
doc_rest=html_r_r
soup_restaurant_content= BeautifulSoup(doc_rest, 'html.parser')
star_text = soup_restaurant_content.find('img').get('alt')
if star_text in ['1-star','2-star','3-star']:
rev['review_label'].append('Negative')
elif star_text in ['4-star','5-star']:
rev['review_label'].append('Positive')
else:
print('check')
rev['review_text'].append(soup_restaurant_content.find('p','text').get_text())
我希望评论存储在列表rev 中,评论文本存储在review_text 列中,评论标签(无论是正面还是负面)在review_label 下。它看起来像
'review_text' 'review_label'
review_1 positive
review_2 negative
【问题讨论】:
标签: python nlp text-mining