【发布时间】:2012-08-24 12:11:14
【问题描述】:
我正在尝试将本地 HTML 转换为 PDF,但 html 文档包含非 ASCII 字符,最终在 PDF 中被破坏。为什么pisa 不适用于所有 UTF-8 字符?
with open('file.html') as m:
data = m.read()
m.close()
pisa.CreatePDF(data, file('final.pdf', 'w'))
【问题讨论】:
-
我没有使用
pisa的经验,但是您确保您的 HTML 声明了正确的字符集吗? -
确实如此,一切都在浏览器中正确显示
-
它们在 PDF 中的实际外观如何?你能提供截图和产生问题的实际字节吗?
-
也许
pisa想要直接的 unicode。尝试在其中添加data = data.decode('UTF-8')。 -
data是编码字节字符串,还是unicode对象?