【发布时间】:2014-05-31 08:23:32
【问题描述】:
使用 PHP 我想删除除
之外的所有 HTML 属性“src” 属性来自 “img” 标签
和
“href” 属性来自 “a” 标记
我的输入文件是由.doc和.docx
转换而来的.html文件我的输出文件再次应该是 HTML 文件 删除属性
请帮帮我
编辑 ::
在尝试如下亚历山大脚本后,如果我在代码编辑器中打开 strip.html,我看不到任何更改
<?php
$path = '/var/www/strip.html';
$html = file_get_contents($path);
$dom = new DOMDocument();
$dom->strictErrorChecking = false;
$dom->formatOutput = true;
$dom->loadHTML($html);
$xpath = new DOMXPath($dom);
if (false === ($elements = $xpath->query("//img"))) die('Error');
foreach ($elements as $element) {
for ($i = $element->attributes->length; --$i >= 0;) {
$name = $element->attributes->item($i)->name;
if ('src' !== $name) {
$element->removeAttribute($name);
}
}
}
if (false === ($elements = $xpath->query("//a"))) die('Error');
foreach ($elements as $element) {
for ($i = $element->attributes->length; --$i >= 0;) {
$name = $element->attributes->item($i)->name;
if ('href' !== $name) {
$element->removeAttribute($name);
}
}
}
$dom->saveHTMLFile($path);
?>
【问题讨论】:
-
@stefan 如何让它像我输入 html 并单击一个按钮我应该要求保存处理后的 html 文件一样工作???
-
该链接应该可以帮助您入门,我不会为您构建您的应用程序,但在您获得 html 之后,无论如何,通过正则表达式传递它。
标签: php