【发布时间】:2025-12-25 00:50:12
【问题描述】:
我正在尝试将字符串转换为 seo 友好的 url。为此,我编写了下面的代码并将表列排序规则类型设置为 utf8_general_ci 它适用于英语,但不适用于孟加拉语。只为孟加拉语字符串输出单个连字符(-)
function seo_url( $string, $separator = '-' )
{
$accents_regex = '~&([a-z]{1,2})(?:acute|cedil|circ|grave|lig|orn|ring|slash|th|tilde|uml);~i';
$special_cases = array( '&' => 'and', "'" => '');
$string = mb_strtolower( trim( $string ), 'UTF-8' );
$string = str_replace( array_keys($special_cases), array_values( $special_cases), $string );
$string = preg_replace( $accents_regex, '$1', htmlentities( $string, ENT_QUOTES, 'UTF-8' ) );
$string = preg_replace("/[^a-z0-9]/u", "$separator", $string);
$string = preg_replace("/[$separator]+/u", "$separator", $string);
return $string;
}
有没有像孟加拉语一样的 unicode 解决方案
【问题讨论】:
-
你能给我们一个你想要转换的原始字符串的例子吗?
-
例如这个字符串“নিরাপদ সড়কের সব উদ্যোগ আটকে যাকে যাচ্ছে”如果您尝试使用该函数将这个字符串转换为单个 hypen(-) 函数,它只会将该字符串转换为单个 seo。
-
好的,谢谢,您期望的结果是什么?我不知道孟加拉语,但在使用俄语 url 时遇到了同样的问题,你想要一些“语音”等效的 url 吗?目前孟加拉语网址的最佳做法是什么?
-
喜欢这个 নিরাপদ-সড়কের-সব-উদ্যোগ-আটকে-যাচ্ছে>两个词之间的间隙中的连字符
-
这是你真正可以使用a third-party library的情况。