【发布时间】:2025-11-25 06:05:01
【问题描述】:
我正在尝试将 txt 文件编码从 UTF8 转换为 ANSI (cp1252)。
我需要这个,因为该文件用于固定位置的 Oracle 导入(外部表),显然只支持 CP1252。如果我导入一个 UTF-8 文件,一些特殊字符会变成两个不正确的字符。
我在一台 Unix 机器上工作(我的操作系统是 HP UX)。我一直在网上寻找答案,但找不到任何方法来进行这种转换。
例如,POSIX iconv 命令没有这个选项,实际上 UTF8 仅用作“to”编码 (-t),但从不用作“from”编码 (-f)。 iconv -l 返回一个包含转换对的长列表,但 UTF8 始终只在第二列。
如何通过 UNIX 将我的文件转换为 CP1252?
【问题讨论】:
-
UTF-8 未列为“to”编码,因为您可能会丢失进入该表单的信息。
-
@ThomasDickey 你的意思是反过来吗?您会丢失从 UTF8 到 CP1252 的信息吗?
-
是的 - 手比大脑快:-)
标签: oracle unix encoding utf-8