【发布时间】:2018-08-16 19:13:10
【问题描述】:
我有一个如下所示的数据框:
Text
0 this is amazing
1 nan
2 wow you are great
我想将数据框单元格中的每个单词迭代到 textblob 中,以获取新列中的极性。然而,许多行中有nan。
我认为这导致 TextBlob 在新列中为所有行(即使是其中包含文本的行)实现 0.0 的极性分数。
如何对列中的每个文本运行 TextBlob.sentiment.polarity 并使用极性分数创建一个新列?
新的 df 应该是这样的:
Text sentiment
0 this is amazing 0.9
1 nan 0.0
2 wow you are great 0.8
我不关心nan,所以情绪值可以是nan或0。
当前不工作的代码:
for text in df.columns:
a = TextBlob(text)
df['sentiment']=a.sentiment.polarity
print(df.value)
提前谢谢你。
编辑:
补充一点,不确定这是否有区别,df 上的索引没有重置,因为 df 的其他部分按相同的索引号分组在一起。
【问题讨论】:
标签: python python-3.x pandas textblob