【发布时间】:2026-01-11 05:30:02
【问题描述】:
我正在创建一个消息过滤系统,用于检测 z͎͗ͣḁ̵̑l̉̃ͦg̐̓̒o͓̔ͥ。
我当前的正则表达式是/([^\u0009-\u02b7\u2000-\u20bf\u2122\u0308]|(?![^aeiouy])\u0308)/gm
但这也捕获了表情符号。
Regex应该过滤所有W̵̢ë̸̩ị̵̽r̴̺̆d̴̴̴̘̘͎̕̕ẗ̷͕x̷̮ṱ̸̷̮̏ṱ̸̸̜̏͒ļ̵̶̱͐k̸̗̈ě̸̸͖̗̈ě̸̸͖̥̄h̸̰̔i̵̵̿̿͜͜k̸̗̈ě̸̸͖̗̈ě̸̶̶̸̸̵̴̛̛͖̤̰̔̿͜x̷̶̸̸̸̵ke̸̸̵̷h̵i̷s̴,但不应捕获EMOJIS。 ????
【问题讨论】:
-
“过滤器”是什么意思?删除这些文本,还是“规范化”?
-
@WiktorStribiżew Liley 从聊天条目中删除他们
-
检测是否有任何 zalgo 在字符串中。例如->
const hasZalgo = zalgo.match(zalgoPattern);
标签: javascript regex string regular-language zalgo