【发布时间】:2015-09-15 19:29:46
【问题描述】:
所以我在这里,我整天都在阅读有关编码的信息,现在我需要澄清一下。
首先我将 eclipse mars 与 pydev 一起使用。
Unicode 是一个(字符集+代码点),基本上是一个与数值相关的符号表。 这些值以二进制级别存储的方式由编码定义,比如说 UTF-8。
1 : shebang
shebang 有什么用?当我输入# -*- coding: utf-8 -*- 时,它有什么作用吗?还是它只是表明我的文件是用 UTF-8 编码的(但因为它只是表明它可能是一个谎言:o)
2 : Eclipse file encoding
写完shebang并保存后,我进入文件的属性,它说编码:ISO-8859-1,所以我的猜测是shebang除了指示我的文件是哪种编码之外什么都不做。 我需要手动将每个文件设置为 UTF-8,还是有办法教 eclipse 读取 shebang 并采取相应措施。
3 : Why does the shebang only specify the encoding?
我的 shebang 说 utf-8,好吧,那又怎样?它没有告诉我使用了哪个字符集。 由于 UTF-8 只是一种编码,我可以将 UTF-8 与任何字符集一起使用吗? 如果我愿意,我可以用 UTF-8 编码 ASCII,因为编码只是转换和存储/读取代码点的一种方式。 如果我用 utf-8 编码的字符集没有与 unicode 相同的代码点怎么办? (这可能吗?)
4 : maybe a solution?
我经常读到 utf-8 是 unicode 的实现,那是不是每次读 encoding = UTF-8 你可以是 100%,我说是 100%,确定字符集+码位是 unicode ?
我迷路了
【问题讨论】:
-
脚本描述行添加不是答案。模块之间的编码是未定义的。 Python 自动获取当前系统的编码。您的系统必须采用 utf-8 编码。将您的 os 参数设置为 utf-8 编码系统。 Python 每次运行时都从本地编码中获取信息。如果您想使用 UTF-8,Unicode 对您没有任何好处。
-
请将您的问题限制为每个问题一个问题
标签: python python-2.7 unicode encoding utf-8