【问题标题】:Disable non-English characters?禁用非英文字符?
【发布时间】:2013-02-07 01:00:23
【问题描述】:

我的一个页面被窃听,我从 Google 收到一条消息,说它是印度尼西亚语。 如果需要,这里有一个 .txt 链接:http://lc-roleplay.com/account/actions/modelchange/modelchange.txt

我可以以某种方式禁用所有非英文字母吗?

【问题讨论】:

  • “被窃听”是什么意思? “有问题”?对于所有的页内样式和内联样式,有太多要阅读的内容。所有验证错误都无济于事 validator.w3.org/… 提示:对于 HTML 注释,<!------- x <!-- x 相同(两个破折号仅用于打开和关闭 cmets)是什么生成这个,或者您可以将样式移动到.css 文件中吗?
  • 您可以通过删除静态文档中的字符来“禁用”它们。
  • 印度尼西亚语是少数不使用除基本拉丁语 A 到 Z 之外的字母的语言之一,因此“非英语”字符导致错误分类的意义不大。

标签: html text non-english


【解决方案1】:

不,你不能。

没有“英文字母”这样的东西。您所描述的是罗马字符,其中出现在英语中的 52 个也出现在大多数其他语言中。

此外,许多英语单词在书写时都保留了外国口音,例如café、naïve 和façade。

您可以做的最好的事情是通过英语拼写检查来运行您的输入,并拒绝任何具有给定拼写错误百分比的输入。

您可以强制执行 ASCII 编码,但这不会阻止有人向您提供 unicode 输入 - 这只是意味着它被不正确地解码(并且看起来像乱码)

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2016-10-08
    • 1970-01-01
    • 2013-11-15
    • 1970-01-01
    • 1970-01-01
    • 2011-04-08
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多