【发布时间】:2021-09-25 03:33:06
【问题描述】:
用户复制粘贴并发送以下格式的数据:“???????????????????????????????????????? ???” 我需要将其转换为纯 txt(我们可以说 ascii 字符),例如“jovy debbie” 它有不同的字体和格式: 前任: '???????????????????????? ????????????????????? '????????????????????????????????? ???????????????????????? ????????????????????????'
任何帮助将不胜感激,我已经参考了其他堆栈溢出问题但没有运气:(
【问题讨论】:
-
到目前为止您尝试过什么?能否提供一些代码示例?
-
所以.... 只是为了稍微清理一下您的术语,
"???????????????? ????????????????????????"IS 是一个纯字符串,它是 NOT 一种字体。您是正确的,这些不是 ASCII 字符,但您使用的其他术语是错误的。 -
US-ASCII 是UTF-8 characters 的子集。您收到的只是非 ASCII 字符,您显然希望将其映射为 ASCII 字符。但是请注意,一般而言,这不是一个定义非常明确的问题,因为有些字符的映射不明确,甚至根本没有逻辑映射,例如
Ώ,Ԫ,֎,ؠ, ..... -
甚至 表情符号 ????是有效的(可能是)UTF-8 字符的组合!!
-
感谢您纠正我@TomLord。您对如何将其转换为一种通用格式有任何意见吗?然后再根据需要根据常用格式转换成。
标签: ruby-on-rails ruby string