【发布时间】:2021-01-12 00:44:34
【问题描述】:
aw_data = {'first_name': ['Jason', 'Molly', 'Tina', 'Jake', 'Amy'],
'last_name': [" 'Miller' "," 'Jacobson' ", 'Ali', 'Milner', 'Cooze'],
'age': [42, 52, 36, 24, 73],
'preTestScore': [4, 24, 31, 2, 3],
'postTestScore': [25, 94, 57, 62, 70]}
df = pd.DataFrame(raw_data, columns = ['first_name', 'last_name', 'age', 'preTestScore', 'postTestScore'])
df
我的任务是首先删除姓氏列中的引号,并计算该列中有多少单元格在此过程中被删除。
我的工作: 我可以去掉姓氏列中的引号,但我该如何计算它。 我正在使用:
df["last_name"]=df["last_name"].apply(lambda x: x.replace("'",""))
我的输出应该是“二”。 任何帮助表示赞赏。
【问题讨论】:
-
df['last_name'].str.contains("'").sum()? -
@anky 这也将计算其中包含
'的名称(但 OP 的.replace也是如此)。这可能是一个问题,也可能不是。可以使用str.extract -
可以使用str.count, df["last_name"].str.count("'")
标签: python-3.x pandas dataframe data-mining data-processing