【发布时间】:2020-09-12 08:51:50
【问题描述】:
我正在尝试计算我的数据框列中的字符串数。
>>> import pandas as pd
>>> df = pd.DataFrame({'A':['a','b','c',1,2,3],
'B':['pp','qq','rr',3,4,5]})
>>> df
A B
0 a pp
1 b qq
2 c rr
3 1 3
4 2 4
5 3 5
>>> df['A'].str.count('/w')
0 0.0
1 0.0
2 0.0
3 NaN
4 NaN
5 NaN
Name: A, dtype: float64
我应该怎么做而不是df['A'].str.count('/w')?
【问题讨论】:
-
那么,这个数据帧的预期计数是多少?
-
df.A.str.count('[a-zA-Z]+').sum()? -
df.A.contains('\w+').sum()? -
df.apply(lambda x:x.str.contains('\w+').sum())表示每列上的整个数据框。字符串总数为df.apply(lambda x:x.str.contains('\w+').sum()).sum()-->6
标签: python string pandas dataframe count