【发布时间】:2011-04-18 21:20:36
【问题描述】:
我有一堆客户希望在其网站上显示的 MS Word 文件。我已经使用“另存为网页”将它们转换为 HTML——是的,我知道这会产生糟糕的 HTML,但我尝试过的其他方法会丢失嵌入图像的链接。
在大多数情况下,我可以使用 PHP 来清理显示,但有一个项目让我完全困惑:所有单引号和双引号都以带有变音符号(重音)的各种字母出现,我不知道如何检测它们并将它们转换为正确的 HTML 实体。例如:Õ(O波浪号)应该是单引号,Ò(O坟墓)应该是开放双引号,Ó(O锐角)应该是关闭双引号。我尝试了 htmlentities、iconv 和一堆其他方法,但都没有成功。
【问题讨论】:
-
你的输出编码是什么?
标签: php html ms-word character