【发布时间】:2015-11-25 16:12:22
【问题描述】:
好的,所以我一直在用头撞桌子。
我正在导入一个由 Indesign 导出的 XML 文件。这会解析它并根据输入创建一个文件。 (我正在用 Node 构建一个 JS 应用程序)
这个文件在我的 PHPStorm IDE 中看起来不错。但是当我在 gedit 中打开它时,我会在这里和那里看到一些不需要的换行符。
我设法找到了这个字符:->
<-(它确实存在 - 将它复制到某处并使用箭头键将光标移动到它上面。它卡在中间)。
十六进制编辑器查看的这个字符显示它是0x80 0xE2 0xA9
当我尝试使用简单的 javascript 替换来替换它时;
data = data.replace('
', ''); //There IS a character in the left one. Trust me.
我收到以下解析错误;
在 vim 中,它在该位置显示以下字符; ~@�
我将如何从我的输出中删除它?转义 JS 代码中的字符导致它编译得很好,但是奇怪的字符仍然存在。我没有想法。
【问题讨论】:
-
不就是可以用 Notepad++ (en.wikipedia.org/wiki/Byte_order_mark) 等编辑器删除的“BOM”字节顺序标记吗?
-
@pataluc 根据您自己的链接,它不是。
-
有趣 - 似乎现在 chrome 确实打印了这个字符。它曾经是隐形的。
标签: javascript utf-8 character-encoding file-encodings