【发布时间】:2016-12-30 10:31:32
【问题描述】:
我必须处理来自大型机的文件。文件中有一些非拉丁文本。我必须为一些无效字符处理这个非拉丁字符。由于大型机将数据编码为EBCDIC 格式,因此我必须将其转换为ASCII 进行验证。
我使用this 代码将EBCDIC 转换为ASCII。但是当我为示例输入执行程序时,我得到的是Hello there] 而不是Hello there!。
我还对照EBCDICtable检查了样本输入。
我还使用this 生成了查找表。但结果相同。
- 我做错了什么吗?还是查找表错误?
- 有没有其他方法可以验证无效字符而不转换为
ASCII?
示例代码如下...
#include <stdio.h>
static const unsigned char e2a[256] = {
0, 1, 2, 3,156, 9,134,127,151,141,142, 11, 12, 13, 14, 15,
16, 17, 18, 19,157,133, 8,135, 24, 25,146,143, 28, 29, 30, 31,
128,129,130,131,132, 10, 23, 27,136,137,138,139,140, 5, 6, 7,
144,145, 22,147,148,149,150, 4,152,153,154,155, 20, 21,158, 26,
32,160,161,162,163,164,165,166,167,168, 91, 46, 60, 40, 43, 33,
38,169,170,171,172,173,174,175,176,177, 93, 36, 42, 41, 59, 94,
45, 47,178,179,180,181,182,183,184,185,124, 44, 37, 95, 62, 63,
186,187,188,189,190,191,192,193,194, 96, 58, 35, 64, 39, 61, 34,
195, 97, 98, 99,100,101,102,103,104,105,196,197,198,199,200,201,
202,106,107,108,109,110,111,112,113,114,203,204,205,206,207,208,
209,126,115,116,117,118,119,120,121,122,210,211,212,213,214,215,
216,217,218,219,220,221,222,223,224,225,226,227,228,229,230,231,
123, 65, 66, 67, 68, 69, 70, 71, 72, 73,232,233,234,235,236,237,
125, 74, 75, 76, 77, 78, 79, 80, 81, 82,238,239,240,241,242,243,
92,159, 83, 84, 85, 86, 87, 88, 89, 90,244,245,246,247,248,249,
48, 49, 50, 51, 52, 53, 54, 55, 56, 57,250,251,252,253,254,255
};
void ebcdicToAscii (unsigned char *s)
{
while (*s)
{
*s = e2a[(int) (*s)];
s++;
}
}
int main (void) {
unsigned char str[] = "\xc8\x85\x93\x93\x96\x40\xa3\x88\x85\x99\x85\x5a";
ebcdicToAscii (str);
printf ("%s\n", str);
return 0;
}
提前致谢。
【问题讨论】:
-
你的桌子错了。
0x5a因为 ebcdic 确实是!,但是您的翻译表将其解码为93(0x5d),在 ascii 中是],而不是!。 -
注意,不需要在
e2a[(int) (*s)]中转换(int)。e2a[*s]就足够了。 -
该表还尝试“EBCDIC 到 ASCII”,因为ASCII 仅定义了 0 到 127 的代码,并且该表发出大于 127 的值并且不包含“非拉丁字符”。当然,OP 正在使用某种风格的 extended ASCII。
-
您是如何从大型机获取数据的?为什么你不能使用它的内置功能,并要求技术支持人员向你展示一个正在工作的东西,所以你需要做......什么都不做?滚动你自己的字符集转换是……没有必要的。