【发布时间】:2016-03-04 02:18:00
【问题描述】:
我正在使用 erlang 从 twitter 收集推文,并且我正在尝试仅将主题标签保存到数据库中。但是,当我将位字符串转换为列表字符串时,所有非拉丁字母推文都会转换为奇怪的符号。 有没有办法检查一个字符串是否只包含 erlang 中的字母数字字符?
【问题讨论】:
-
解决主要问题不是更好吗?要正确转换 utf8 编码的位串,请不要使用
binary_to_list,而是使用unicode-module。 -
对不起,我很讨厌 erlang。你的意思是?我可以使用 unicode 模块仅将拉丁字母推文转换为列表吗?
-
不,这意味着如果您想处理 utf8 编码的位串(所有特殊符号都正确表示),请使用正确的模块。
-
对不起,我尝试使用 unicode:characters_to_list/2 并且它可以正确转换所有内容。但是,我认为无论如何我都不需要保存字母数字主题标签。不过,我真的很感谢您的帮助。
-
不用解释了,我不久前也遇到过你的情况;-)
标签: string erlang alphanumeric