【问题标题】:Spanish characters are incorrect西班牙语字符不正确
【发布时间】:2012-04-23 13:15:52
【问题描述】:

我下载了一个带有 cURL 的页面,并使用“PHP Simple HTML DOM Parser”解析了 html。 问题是当它显示元素的外部 html 时,西班牙语字符不正确。 例如:

原文

la puja por la compra de los derechos de publicación ha sido la más reñida del año。

显示的文字

la puja por la compra de los derechos de publicación ha sido la más reñida del año。

什么会导致字母改变?

【问题讨论】:

    标签: php html curl


    【解决方案1】:

    我很确定因为它在输出中显示为多个字符,这是因为您试图在单字节字符集中显示一些多字节 UTF8 字符(可能是 ISO-8859-1)。

    看看我不久前写的this blog post,它应该会告诉你所有潜在的问题领域。

    【讨论】:

      【解决方案2】:

      不正确的字符编码 - 确保整个编码是一致的,我建议使用 UTF-8

      【讨论】:

      • 正确答案,但对我没有任何好处,因为您没有描述如何使用 cURL 确保它
      【解决方案3】:

      您必须确定下载页面的编码是什么,然后(例如通过 iconv)将其转换为您的编码。

      PHP: Convert curl_exec output to UTF8

      【讨论】:

        猜你喜欢
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 2023-03-18
        • 2012-10-26
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        • 1970-01-01
        相关资源
        最近更新 更多