【发布时间】:2020-05-27 04:38:52
【问题描述】:
所以我基本上想做的是以下内容,基于具有“日期”和“极性”列的数据框,“日期”(天)中有七个不同的值,“极性”中的值介于 -1 和1:
For each of the seven days:
i) count all values in the 'polarity' column that are positive
ii) count all values in the 'polarity' column that are negative
iii) count all values in the 'polarity' column for a given day (neg, neutral, pos)
编辑:输出应该是每个 i)-iii) 每天的整数,存储在列表中
Edit2:我尝试使用以下代码实现它(仅适用于值 >0):
pos_tweets = df_tweets.apply(lambda x: True if x['polarity'] > 0 and x['date'] == '2020-02-07' else False, axis=1)
num_Pos = len(pos_tweets[pos_tweets == True].index)
然而,这返回 0,即在 Excel 中签入时出错。
感谢您的帮助!
干杯, IG
【问题讨论】:
-
您能否提供一个示例数据集以及预期的输出?
-
添加了预期的输出。数据集是一个 Excel 表格,列格式为“日期”(YYYY-MM-DD),格式为“极性”(每行的值介于 -1 和 1 之间)。
标签: python pandas loops dataframe tweepy