【发布时间】:2015-03-07 13:11:09
【问题描述】:
我一直在寻找合适的解决方案,了解如何将 Unicode 符号 (ἔ) 转换为对应的 Unicode 实体 (ἔ)。我有一个文本文件,其中包含许多此类符号,例如ῶἤÜὰὔ。我正在寻找可以将文件作为参数并处理每个符号并将其等效的 Unicode 实体写入输出文件的 python 甚至 Perl 脚本。我看到了类似的问题here,但它正在处理 html 实体。
【问题讨论】:
-
没有两个不同的东西叫unicode实体和html实体,它们是一样的
-
例如代替 ἔ [HTML 实体(十六进制)] 我需要 ἔ [HTML 实体(十进制)]。
-
为什么?它们是等价的
-
我知道两者是一样的。但是,我的要求是 ἔ而不是 ἔ.