选择短的另一个原因是它与您可能在标记中指定字符集的其他实例相匹配。例如:
<script type="javascript" charset="UTF-8" src="/script.js"></script>
<p><a charset="UTF-8" href="http://example.com/">Example Site</a></p>
一致性有助于减少错误并使代码更具可读性。
请注意,charset 属性不区分大小写。您可以使用 UTF-8 或 utf-8,但 UTF-8 更清晰、更易读、更准确。
此外,绝对没有理由在元字符集属性或页眉中使用 UTF-8 以外的任何值。 UTF-8 是自 1999 年 HTML4 以来 Web 文档的默认编码,也是制作现代网页的唯一实用方法。
您也不应该在 UTF-8 中使用 HTML 实体。应直接键入版权符号等字符。您应该使用的唯一实体是 5 个保留标记字符:小于、大于、与号、素数、双素数。实体需要一个 HTML 解析器,你可能并不总是想继续使用它,它们会引入错误,降低代码的可读性,增加文件大小,并且有时在各种浏览器中解码不正确,具体取决于你使用的实体。了解如何键入/插入版权、商标、开引号、闭引号、撇号、破折号、破折号、项目符号、欧元以及您在内容中遇到的任何其他字符,并在代码中使用这些实际字符。 Mac 有一个字符查看器,您可以在键盘系统偏好设置中打开它,您可以找到并拖放您需要的字符,或者使用匹配的键盘查看器查看要键入的键。例如,商标是 Option+2。 UTF-8 包含来自每种书面人类语言的所有字符和符号。因此,没有任何借口可以使用 -- 而不是破折号。学习标点符号和排版规则也不是一个坏主意……例如,知道句点在紧引号内,而不是在外。
对内容类型和编码之类的内容使用标签非常重要
具有讽刺意味的是,因为不知道这些东西,您无法解析文件
获取元标记的值。
不,那不是真的。浏览器开始将文件解析为浏览器的默认编码,UTF-8 或 ISO-8859-1。由于 US-ASCII 是 ISO-8859-1 和 UTF-8 的子集,因此浏览器可以以任何一种方式读取......它是一样的。当浏览器遇到元字符集标签时,如果编码与浏览器已经使用的不同,浏览器会以指定的编码重新加载页面。这就是为什么我们把 meta charset 标签放在顶部,就在 head 标签之后,在其他任何东西之前,甚至是标题。这样您就可以在标题中使用 UTF-8 字符。
您必须以不带 BOM 的 UTF-8 编码保存文件
这并不完全正确。如果您的文档中只有 US-ASCII 字符,则可以将其另存为 US-ASCII 并将其作为 UTF-8 提供,因为它是一个子集。但是如果有 Unicode 字符,你是对的,你必须 Save as UTF-8 without BOM。
如果您想要一个可以保存文件的优秀文本编辑器
在 UTF-8 中,我推荐 Notepad++。
在 Mac 上,使用 Mac App Store 中的 Bare Bones TextWrangler(免费)或 Mac App Store 中的 Bare Bones BBEdit,价格为 39.99 美元……对于这样一款出色的工具来说非常便宜。在任一应用程序中,文档窗口底部都有一个菜单,您可以在其中指定文档编码,您可以轻松选择“UTF-8 no BOM”。当然,您可以在首选项中将其设置为新文档的默认设置。
但如果您的网络服务器在 HTTP 标头中提供编码,
这是推荐的,两个[元标签]都是不需要的。
这是不正确的。您当然应该在 HTTP 标头中设置编码,但您还应该在 meta charset 属性中设置它,以便用户可以将页面从浏览器中保存到本地存储中,然后稍后再次打开,在这种情况下将出现的唯一编码指示是元字符集属性。出于同样的原因,您还应该设置一个基本标记……在服务器上,基本标记是不必要的,但是当从本地存储打开时,基本标记使页面能够像在服务器上一样工作,所有资产到位等,没有损坏的链接。
AddDefaultCharset UTF-8
或者您可以像这样更改特定文件类型的编码:
AddType text/html;charset=utf-8 html
同时提供 UTF-8 和 Latin-1 (ISO-8859-1) 文件的提示是给 UTF-8 文件一个“text”扩展名和 Latin-1 文件“txt”。
AddType text/plain;charset=iso-8859-1 txt
AddType text/plain;charset=utf-8 text
最后,考虑使用 Unix 行结尾保存您的文档,而不是传统的 DOS 或(经典)Mac 行结尾,这无济于事而且可能会造成伤害,尤其是当我们离这些传统系统越来越远时。具有有效 HTML5、UTF-8 编码和 Unix 行尾的 HTML 文档是一项出色的工作。您可以在许多情况下共享、编辑、存储、读取和恢复并依赖该文档。是通用语。是电子纸。