【发布时间】:2014-06-06 15:06:17
【问题描述】:
例子:
<p>Um diese App verwenden zu können, benötigen Sie JavaScript.</p>
应替换为:
<p>Um diese App verwenden zu können, benötigen Sie JavaScript.</p>
是否存在在区域上执行这种替换的现有函数或包?
【问题讨论】:
-
快速谷歌搜索有点令人沮丧。 HTML 中有大量代码可以解码 实体,但反方向的代码很少。
w3m.el包含一个实体数据库,作为起点应该很方便;我猜各种 HTML 和 XML 编辑模式都会包含类似的内容。 -
如果您不需要命名实体,用
(format "&#%d;" (int-to-string (string-to-char char)))替换[^ -~]应该是轻而易举的事。 -
为什么要这样做?命名实体将使它无效的 XHTML,如果这恰好是一个问题。如今,unicode 可以毫无问题地在绝大多数工具链中来回切换。
-
我拼凑了一个愚蠢的尝试,我无法开始工作。它只能支持 Latin-1,因为这是我用作平台的
sgml-mode.el中可用的内容。也许其他人可以从我离开的地方继续并完成它。显然,我不太了解字符表。例如,它将"¤"变成"&dollar;",这显然是不正确的。 pastebin.com/cVQUTS9s -
@torazaburo 好吧,在我的工作场所,我们有使用 ASCII 的编码标准。总的来说,我认为使用 JSP 是合理的,因为它使事情变得简单。否则,总是有可能混淆 ISO-8859-1 和 UTF8,这可能会导致细微的错误。无论如何,你有一个观点:stackoverflow.com/questions/25132/…