【发布时间】:2018-12-18 14:47:39
【问题描述】:
我从输入文件中读取文本行,剪切后我有字符串:
-pokaż wszystko-
–ყველას გამოჩენა–
我必须像这样写到其他文件:
-poka\017C wszystko-
\2013\10E7\10D5\10D4\10DA\10D0\10E1 \10D2\10D0\10DB\10DD\10E9\10D4\10DC\10D0\2013
我的 python 脚本启动:
file_input = open('input.txt', 'r', encoding='utf-8')
file_output = open('output.txt', 'w', encoding='utf-8')
不幸的是,写入文件不是它所期望的。
我知道为什么我必须更改它,但无法弄清楚转换:
以 UTF-8 保存的变音符号(“-pokaż wszystko-”),只有在 NLS_LANG = AMERICAN_AMERICA.AL32UTF8 时才能正常工作
如果输出文件有以转义形式保存的变音符号(“-poka\017C wszystko-”),则该脚本适用于任何 NLS_LANG 设置
【问题讨论】:
-
您有转义格式的规范吗?这并不熟悉。另外,动机是什么?您的输出字符编码是 UTF-8,因此您不需要转义。
标签: python-3.x oracle unicode utf-8 diacritics