【发布时间】:2020-09-03 13:02:53
【问题描述】:
我正在尝试修改文件的每一行以删除以字符 '(' 开头或在方括号中包含数字/字符 ie'[2] 的任何部分强>':
f = open('/Users/name/Desktop/university_towns.txt',"r")
listed = []
import re
for i in f.readlines():
if i.find(r'\(.*?\)\n'):
here = re.sub(r'\(.*?\)\[.*?\]\n', "", i)
listed.append(here)
elif i.find(r' \(.*?\)\n'):
here = re.sub(r' \(.*?\)\[.*?\]\n', "", i)
listed.append(here)
elif i.find(r' \[.*?\]\n'):
here = re.sub(r' \[.*?\]\n', "", i)
listed.append(here)
else:
here = re.sub(r'\[.*?\]\n', "", i)
listed.append(here)
我的输入数据的样本:
Platteville (University of Wisconsin–Platteville)[2]
River Falls (University of Wisconsin–River Falls)[2]
Stevens Point (University of Wisconsin–Stevens Point)[2]
Waukesha (Carroll University)
Whitewater (University of Wisconsin–Whitewater)[2]
Wyoming[edit]
Laramie (University of Wyoming)[5]
我的输出数据示例:
Platteville
River Falls
Stevens Point
Waukesha (Carroll University)
Whitewater
Wyoming[edit]
Laramie
但是,我不想要“(卡罗尔大学)”或“[编辑]”等部分。
我如何修改我的公式?
如果有人能给我任何建议,我将不胜感激!
【问题讨论】:
-
为什么在此处标记
pandas?看不出与该问题有多大相关性。 -
@MayankPorwal 抱歉让您不高兴了!它已被删除:)