【发布时间】:2012-07-11 23:29:46
【问题描述】:
我需要压缩表单的一些文本数据
[70,165,531,0|70,166,562|"hi",167,578|70,171,593|71,179,593|73,188,609|"a",1,3|
数据包含几千个字符(大约 10000 - 50000 个)。
我阅读了各种压缩算法,但无法决定在这里使用哪一种。
这里重要的是:压缩字符串应该只包含字母数字字符(或一些特殊字符,如 +-/&%@$..)我的意思是大多数算法都提供乱码 ascii 字符压缩数据对吗?必须避免这种情况。
有人可以指导我如何在这里进行吗?
P.S 文本主要包含 numbers 、 ' 和 | 字符。其他字符很少出现。
【问题讨论】:
-
“大多数算法都提供乱码 ascii 字符”——不,它们提供 字节。字节和字符是不同的东西。
标签: algorithm text compression