【发布时间】:2017-11-10 21:06:19
【问题描述】:
我有以下类型的数据:
pd.DataFrame({"Hashtags": [ "[]", "[u'AAPHealthCare4All']", "[u'CBI',","u'Delhi',", "u'Emergency']"]})
预期输出
pd.DataFrame({"Hashtags": [ " ", "AAPHealthCare4All", "CBI","Delhi", "Emergency"]})
括号、括号或逗号和引号均未丢失/错字。 [] 应替换为空格。基本上我想删除所有 "[" , "]" , " [u' " 等。 我使用了以下代码,但无济于事:
for index,row in df.iterrows():
if "RT @" in row["Tweet"]:
df['Hashtags'] =df['Hashtags'].str.replace(r'[^[]]*\[|\][^]*|\[u\'*\'\]|\[\'*\'\]', '')
df.to_csv('string_HT.csv', index=False)
【问题讨论】:
标签: python regex string pandas replace