【问题标题】:Getting frequency of words from a pandas dataframe column [duplicate]从熊猫数据框列中获取单词的频率[重复]
【发布时间】:2021-02-26 11:29:41
【问题描述】:

我有一个数据框,其中包含来自电影的多个演员的列 cast。如何计算每个演员出现在数据集中的次数 这是该列的外观的 sn-p

df['cast'][:3]
0    João Miguel, Bianca Comparato, Michel Gomes, R...
1    Demián Bichir, Héctor Bonilla, Oscar Serrano, ...
2    Tedd Chan, Stella Chung, Henley Hii, Lawrence ...
Name: cast, dtype: object

谁能帮忙?

【问题讨论】:

    标签: pandas join split counter strsplit


    【解决方案1】:

    例如,使用以下代码 sn-p 查找“Stella Chung”的计数:

    " ".join(df['cast'].values).count('Stella Chung')

    更新:

    下面是对正在做的事情的解释:

    • df['cast'].values 返回一个数组,其中包含来自名为 cast 的列中的所有单个列值。
    • " ".join(array) 将数组中的所有字符串连接成一个大字符串
    • string.count(substring) 返回子字符串在主字符串中出现的次数。

    【讨论】:

    • 感谢您的回复。你能把它分解并解释一下吗?
    • 更新了答案。如果这解决了您的问题,请随时接受答案(在投票部分下方打勾)
    • 感谢您的详细解释。现在对我来说更有意义了,是的,它帮助了我
    • 您可以通过单击左侧的灰色大复选按钮来接受一个答案(如果它对您有帮助)。如果您希望可以通过单击上方灰色三角形为任何好的答案的任何作者添加 +10 分
    • 哦,好的,我已经做到了
    猜你喜欢
    • 2018-03-28
    • 2015-06-06
    • 2019-08-02
    • 1970-01-01
    • 1970-01-01
    • 2018-12-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多