【发布时间】:2011-11-23 07:33:21
【问题描述】:
我正在使用pyodbc 将数据从MS-Excel 导入python(2.6) 中的PostgreSQL。
面临的问题是:
excel源码中有left single quotation mark(ANSI hex code : 0x91)等字符。现在,当它使用 pyodbc 导入 PostgreSQL 时,它会终止并给出错误 DatabaseError: invalid byte sequence for encoding "UTF8": 0x91。
我尝试了什么:我暂时使用decode('unicode_escape')。但是,这不能完成,因为这只会删除/转义相关字符。
替代试验:最初解码,Unicode 无处不在,然后在需要时从数据库中编码。由于手头的项目范围很广,这也无法做到。
请建议我一些方法/程序/内置函数来完成任务。
【问题讨论】:
-
不知道这是否回答了您的问题。但您可能会发现 this related answer 有一些用处。
-
嘿,谢谢你的努力。我阅读并尝试使用 encode('utf-8') 但出现以下错误:
UnicodeDecodeError: 'ascii' codec can't decode byte 0x92 in position 33: ordinal not in range(128)
标签: python excel postgresql unicode pyodbc