【发布时间】:2023-04-06 15:34:02
【问题描述】:
这不是很重要,但我想知道您是否可以让 HTMLPurifier 省略参数周围的双引号。当它过滤 HTML 时,通常会将其重新格式化为 XHTML 语法。
但我更喜欢在输出中使用<div class=alphanum> 而不是class="xyz" - 只要有可能。
配置设置http://htmlpurifier.org/live/configdoc/plain.html 没有提供明显的选项,我也没有费心去查看代码(500K 确实吓跑了你)。 HTMLPurifier 在某些时候确实使用了 DOMDocument。我不确定这是否只是用于预解析,还是用于输出序列化(然后我可以自己回答这个问题:否)。
我浏览了htmlpurifier 标签,一无所获。并且启用实验性(?)HTMLPurifier/Lexer/PH5P.php 解析器不会改变 输出 行为。
那么有什么不常见的设置或调整吗?
【问题讨论】:
-
我知道我可以在清理后使用正则表达式。但我最好不要在这里写。 :} -- 至于用例:只是想改掉坏习惯。我只有一个真正的 XHTML 站点 [= 只有在我的书中使用正确的 mime 类型时才会如此]。并且现在更喜欢使用 SGML 表示法,因为它又是一流的。
-
使用引号其实并不是坏习惯。 W3C recommends using quotation marks even when it is possible to eliminate them.
-
我接受这是最权威的建议。它仍然可能对可读性造成压力(想避开),而且现在大多数 XML 工具包都提供 HTML 模式,因此在技术上不再需要它。
-
从我的旅行中,我认为这是不可能的,我相信你会知道如何编写正则表达式来剥离它们:)
标签: htmlpurifier php html htmlpurifier