【发布时间】:2021-09-19 05:37:23
【问题描述】:
我一直在尝试将句子中的搜索词加粗。如果句子是Engliš is spoken wörldwide. 如果我的搜索词是spoken world 我想得到Engliš is <b>spoken wörld</b>wide.
我用过这个功能:
function highlightWords($text, $searchTerm){
$corr = ['a' => '[aäâ]', 'o' => '[oöòóôõ]', 'c' => '[cç]', 's' => '[şśšșŝ]', 'y' => '[ýÿŷȳy]', 'o' => '[ôöòóøōoõ]', 'n' => '[ñńňn]', 'u' => '[üu]'];
$key = preg_quote($searchTerm);
$pattern = '/' . strtr($key, $corr) . '/iu';
$text = preg_replace($pattern, '<b>$0</b>', $text);
return $text;
}
它应该可以工作,但我得到了非常奇怪的行为。几个例子是:
文本是Sygmaý çykdy deşdi-sähra düzünden(对不起,奇怪的句子)。当$searchTerm 是duz 时,它完美地工作,我得到Sygmaý çykdy deşdi-sähra <b>düz</b>ünden。如果我将搜索词更改为sahra,该函数将返回纯Sygmaý çykdy deşdi-sähra düzünden。
适用于 cykdy 和 çykdy。
但不适用于sygmay 和sygmaý。但适用于带有大写字母的Sygmaý。
为了在所有场景中突出显示搜索词,我需要解决什么问题?
【问题讨论】:
-
仅供参考:您尝试使用
'a' => '[aäâ]'等解决的问题很可能已经在Intl extension 中解决了,即使不是但是使用您已经使用的 Unicode(/iuPCRE 修饰符)。这仅作为一个指针,因为您特别关注正则表达式,而 IIRC 在那里不可用。但是对于正则表达式的情况,请注意您正在对输入和模式的 Unicode 字符进行规范化,请参阅stackoverflow.com/q/8766675/367456 和相关内容。
标签: php regex preg-replace