【发布时间】:2019-06-10 00:47:14
【问题描述】:
我正在尝试纠正一些 OCR 错误,我需要将 ''(双顶点)替换为 "(引号)。我正在使用 Subtitledit(我认为它使用 C# Regex)。
我每次都需要匹配'',但在这种情况下不需要:
some text 'undefined length phrase/phrases''
第一个 ' 前面应该有一个空格,然后是 \w。
如果前面没有\s'\w.*,基本上我想匹配''。
在这个例子中:
''E poi disse: 'Ne voglio un po'', ed andò via.''
我想匹配第一个和最后一个'',但不匹配中间的那个,因为它前面是'Ne voglio un po。
我尝试了this,但它不起作用,因为量词不能在后视中使用。
【问题讨论】:
-
那么,你想要
(?<!\S)''\b?见regex101.com/r/jvEqXl/1 -
"不是这种情况" 准确是如何定义这种情况的?你只举了一个例子,可以用多种不同的方式来解释。据我了解,您想替换
'',除非那些''是文本字符串中的最后两个字符。 (换句话说,您想要替换''即 not 后跟文本结尾。或者换句话说:您想要替换''后跟某个字符。 ) -
如果前面没有\s'\w.*,我想匹配''