【发布时间】:2014-08-26 16:03:02
【问题描述】:
我有以下字符串:
1 "R J BRUCE & OTHERS V B J & W L A EDWARDS And Ors CA CA19/02 27 February 2003",
2 "H v DIRECTOR OF PROCEEDINGS [2014] NZHC 1031 [16 May 2014]",
3 '''GREGORY LANCASTER AND JOHN HENRY HUNTER V CULLEN INVESTMENTS LIMITED AND
ERIC JOHN WATSON CA CA51/03 26 May 2003'''
我正在尝试找到一个匹配所有这些的正则表达式。我不知道如何匹配字符串末尾日期周围的可选方括号,例如 [16 May 2014]。
casename = re.compile(r'(^[A-Z][A-Za-z\'\(\) ]+\b[v|V]\b[A-Za-z\'\(\) ]+(.*?)[ \[ ]\d+ \w+ \d\d\d\d[\] ])', re.S)
最后的日期正则表达式只匹配带有方括号日期的情况,而不匹配没有日期的情况。
感谢所有回答的人。 @Matt Clarkson 我试图匹配的是更大文本中的司法判决“处理”。这些句柄之间存在很大差异,但它们都从一行的开头开始,在派对名称和末尾的日期之间有“v”代表。当事人的名字大多是大写的,但不是唯一的。我试图每个文档只有一个匹配项,并且没有误报。
【问题讨论】:
-
了解您要在字符串中匹配的什么会很有帮助。
-
第 3 行和第 4 行是否在同一行,或者它们在 'AND' 和 'ERIC' 之间是否包含物理换行符?
-
@OnlineCop 我想说的是,它用三引号括起来,它有一个物理换行符。
标签: python regex optional brackets square-bracket