【发布时间】:2022-01-01 18:19:43
【问题描述】:
我有一个 $text = "你好 ???????????? ?????? ???????? ????üäö$"
我想使用 xquery 从文本中删除表情符号。我该怎么做?
预期结果:“Hello üäö$”
我尝试使用:
replace($text, '\p{IsEmoticons}+', '')
但没用。
它只是删除了笑脸
现在的结果:“你好 ???? ???????? ????üäö$” 预期结果:“Hello üäö$”
提前致谢:)
【问题讨论】:
-
我也使用了 replace($test,"\p{So}+", '') 但它仍然没有删除所有符号结果:“Hello ???????? ?? ??üäö$" link
-
有趣,似乎字符 ` ????
,????????, and????are not part of the\p{IsEmoticons}` 类,至少在xqueryfiddle.liberty-development.net/94hwpi9 使用的Unicode Saxon 10.6 版本中没有。 -
您将需要列举这些字符所属的各种类别,例如
'[\p{IsEmoticons}\p{So}]'作为replace的第二个参数,带有 remove `???????????? ??????`,将需要检查或检查其他角色属于哪个类别或类别。
标签: xquery xquery-3.0