【发布时间】:2021-12-22 02:09:20
【问题描述】:
如何从"⚡hel✅????lo????" 之类的字符串中删除表情符号?
我知道您需要使用Regex 和其他一些东西,但我不确定如何编写语法并替换string 中的所有内容。
谢谢,非常感谢您的帮助。
【问题讨论】:
-
第一步是定义“表情符号”的确切含义。您可能不想删除 Unicode 字符数据库中具有“表情符号”属性的所有字符,因为这将包括 # 和 * 等字符。一个很好的近似值可能是使用“Emoji_Presentation”属性,该属性是为所有默认为表情符号呈现而不是文本呈现的字符设置的。
-
我想这里的主要问题是:你的目标是什么?为什么要从字符串中删除表情符号?
-
我在这里遇到的第一个问题与您的@SvenMarnach 有关,“您将如何使用any 编程语言来做到这一点?”基于白名单?基于黑名单?查找“表情符号”空间与其他字符的标准?大部分问题与 Rust 无关。
-
看起来
unicode_segmentationcrate 可以找到字素簇。那么这只是确定给定字素是否是表情符号的问题