【发布时间】:2025-12-27 16:35:06
【问题描述】:
我正在尝试清理来自多语言网站上的搜索框的字符串。
通常我会使用如下的正则表达式:
$allowed = "-+?!,.;:\w\s";
$txt_search = preg_replace("/[^" . $allowed . "]?(.*?)[^" . $allowed . "]?/iu", "$1", $_GET['txt_search']);
这适用于英文文本。
但是,当输入的文本可以是任何语言(现在是俄语,将来是中文)时,我需要这样做。
如何在保留原始语言的“普通文本”的同时清理字符串?
我想切换到黑名单(虽然我宁愿不...),但此时正则表达式完全破坏了所有原始输入。
【问题讨论】:
标签: php regex filter multilingual