【发布时间】:2017-11-26 23:44:41
【问题描述】:
我正在尝试在 HTML 表格中显示每一行并将内部 HTML 标记保留在结果中,但我无法让它工作,并且它不断剥离 HTML 内部标记什么是最适合我的从 HTML 表中提取行并将内部 HTML 标记保留在结果中?
这是我目前正在使用的代码:
<?php
function tdrows($elements){
$str = "";
foreach ($elements as $element) {
$str .= $element->nodeValue . ", ";
}
return $str;
}
function getdata(){
$content = "<table border="0" cellspacing="0" cellpadding="0" class="ta1"><colgroup><col width="99"/><col width="99"/><col width="99"/><col width="99"/></colgroup><tr class="ro1"><td style="text-align:left;width:2.267cm; " class="ce1"><p>Col A</p></td><td style="text-align:left;width:2.267cm; " class="ce2"><p>Col B</p></td><td style="text-align:left;width:2.267cm; " class="ce3"><p>Col C</p></td><td style="text-align:left;width:2.267cm; " class="ce5"><p>Col D</p></td></tr><tr class="ro2"><td style="text-align:left;width:2.267cm; " class="Default"><p>This <span class="T1">is</span> a test</p></td><td style="text-align:left;width:2.267cm; " class="Default"><p>This is a <span class="T2">test</span></p></td><td style="text-align:left;width:2.267cm; " class="ce4"><p>This<span class="T3"> is</span> a test<span class="T4">2</span></p></td><td style="text-align:left;width:2.267cm; " class="Default"><p>This is a test</p></td></tr></table>";
$DOM = new DOMDocument;
$DOM->loadHTML($contents);
$items = $DOM->getElementsByTagName('tr');
foreach ($items as $node) {
echo tdrows($node->childNodes) . "<br />";
}
}
getdata();
目前在下面显示的是正确的,但缺少内部 HTML 标记。
Col A, Col B, Col C, Col D,
This is a test, This is a test, This is a test2, This is a test,
也许我看错了,应该有另一种方法可以让我从表格中提取信息以获得正确的结果。任何帮助将不胜感激。
【问题讨论】:
-
TYPO:第一个知道 $contents 变量应该是 $content 第二个:双引号问题你需要正确转义 $content 字符串。
-
哪个内部html?与
td或td除外?
标签: php html html-table domdocument