【发布时间】:2013-07-31 19:05:11
【问题描述】:
我正在尝试从字符串中修剪前导和尾随空格和换行符。换行符写成\n(两个单独的字符,斜线和n)。换句话说,它是一个字符串文字,而不是一个 CR LF 特殊字符。
例如,这个:
\n \nRight after this is a perfectly valid newline:\nAnd here is the second line. \n
应该变成这样:
Right after this is a perfectly valid newline:\nAnd here is the second line.
我想出了这个解决方案:
text = text
.replace(/^(\s*(\\n)*)*/, '') // Beginning
.replace(/(\s*(\\n)*)*$/, '') // End
根据RegexPal,这些模式匹配得很好。
但是,第二个模式(匹配字符串的结尾)需要很长时间——在 Chrome 中,只有几个段落和几个尾随空格的字符串大约需要 32 秒。第一个模式在同一个字符串上非常快(毫秒)。
Here is a CodePen to demonstrate it.
为什么这么慢?有没有更好的方法来解决这个问题?
【问题讨论】:
-
@Romoku 我同意另一个问题是关于同一主题的,但我没有看到任何关于正则表达式性能的信息。
-
你有大量的可选性,甚至是嵌套的可选性。那很慢。做
.replace(/^\s+/).replace(/\s+$/) -
查找catastrophic backtracking。这几乎肯定是问题所在。
-
他想将
\n匹配为字符串文字,而不是 CR LF。这就是他用前三个段落解释的内容。这不是灾难性的回溯。
标签: javascript regex performance