【问题标题】:Counting the number of unique words in a dataframe with Python使用 Python 计算数据框中唯一单词的数量
【发布时间】:2020-05-05 09:15:54
【问题描述】:

我是 Python 新手。我没有解决以下问题:

我得到了代表一系列接触点的这种类型的数据框:

    df = pd.DataFrame({'path' : ['a>b>c','b>b','c>c','b>d','a>c>c']})

    path
    a>b>c
    b>b
    c>c
    b>d
    a>c>c

我需要计算每一行的唯一接触点的数量并获得:

    path    count_unique_touchpoint
    a>b>c   3
    b>b     1
    c>c     1
    b>d     2
    a>c>c   2

非常感谢。

【问题讨论】:

    标签: python pandas count unique


    【解决方案1】:

    您可以使用Series.str.split 来拆分分隔符> 周围的字符串,然后使用Series.apply 应用自定义函数,该函数将这个系列的每个项目映射到它包含的不同元素的数量。使用:

    df["count_unique_touchpoint"] = df["path"].str.split(">").apply(lambda s: len(set(s)))
    print(df)
    

    打印出来:

        path  count_unique_touchpoint
    0  a>b>c                        3
    1    b>b                        1
    2    c>c                        1
    3    b>d                        2
    4  a>c>c                        2
    

    【讨论】:

    • 水晶般清澈。非常感谢我们快速高效的回答。
    猜你喜欢
    • 1970-01-01
    • 2020-07-04
    • 1970-01-01
    • 1970-01-01
    • 2015-06-02
    • 1970-01-01
    • 2021-10-24
    • 2012-08-07
    • 1970-01-01
    相关资源
    最近更新 更多