【发布时间】:2011-12-06 16:03:26
【问题描述】:
我正在尝试将我的示例 HTML 输出转换为纯文本,但我不知道如何操作。我使用 file_get_contents 但我尝试转换的页面返回最相似。
$raw = "http://localhost/guestbook/profiles.php";
$file_converted = file_get_contents($raw);
echo $file_converted;
profiles.php
<html>
<head>
<title>Profiles - GuestBook</title>
<link rel="stylesheet" type="text/css" href="css/style.css">
</head>
<body>
<!-- Some Divs -->
<div id="profile-wrapper">
<h2>Profile</h2>
<table>
<tr>
<td>Name:</td><td> John Dela Cruz</td>
</tr>
<tr>
<td>Age:</td><td>15</td>
</tr>
<tr>
<td>Location:</td><td> SomewhereIn, Asia</td>
</tr>
</table>
</div>
</body>
</html>
基本上,我试图回显这样的内容(纯文本,无样式)
Profile
Name: John Dela Cruz
Age: 15
Location: SomewhereIn, Asia
但我不知道怎么做。 :-( 。请帮帮我,提前谢谢你们。
编辑:由于我只是在页面内容之后,无论它是样式还是纯文本,有没有办法使用 file_get_contents() 只选择(见下面的代码)?
<h2>Profile</h2>
<table>
<tr>
<td>Name:</td><td> John Dela Cruz</td>
</tr>
<tr>
<td>Age:</td><td>15</td>
</tr>
<tr>
<td>Location:</td><td> SomewhereIn, Asia</td>
</tr>
</table>
【问题讨论】:
-
感谢 Sergej Jevsejev、josnidhin 和 Jonathan Rich 的快速响应。倍受赞赏。 :-)
-
请注意,说要使用
strip_tags的人并不完全理解或粗心。它将保留您的标题以及任何内联样式表或 JavaScript。你没有后者,但你有一个头衔。 . . -
我使用了 strip_tags,虽然它会去掉 html 标签,但它会返回一个不受欢迎的输出,例如{ 字体:粗体 11px Lucida Grande、Lucida Sans Unicode、Trebuchet MS、Helvetica、Arial、sans-serif;颜色:#045877;填充:15px 0 0 12px;文字装饰:无;显示:块;边距:0 自动; }
-
也许使用 strip_tags 肯定会回答我的问题的标题,正如我所见,它是纯文本,但使用 strip_tags 并不能帮助我返回理想的输出。
-
使用 strip_tags 或者如果您需要带有 html 标签的纯文本,那么:browse-tutorials.com/snippet/…