【发布时间】:2017-08-30 12:50:03
【问题描述】:
通过R,我可以很容易地从字符串列表中制作一个包含某些字符串模式频率的数据框。
library(stringr)
library(tm)
library(dplyr)
text = c('i am so hhappy happy now','you look ssad','sad day today','noway')
dat = sapply(c('happy', 'sad'), function(i) str_count(text, i))
dat = data.frame(dat)
dat = dat %>% mutate(Sentiment = (happy)-(sad))
结果,我可以有这样的数据框
happy sad Sentiment
1 2 0 2
2 0 1 -1
3 0 1 -1
4 0 0 0
在 Python 中,我可以假设除 sapply() 之外的其余代码
import pandas as pd
text = ['i am so hhappy happy now','you look ssad','sad day today','noway']
????
dat = pd.DataFrame(dat)
dat['Sentiment'] = dat.apply(lambda c: c.happy - c.sad)
???? 会是什么?
【问题讨论】:
标签: python string pandas dataframe apply