【发布时间】:2015-06-05 10:47:36
【问题描述】:
我只想拥有网页的内容。假设我想从这个 url 获取 example 的内容,但是在这个页面上有 HTML JS 和其他标签,我想将它们全部删除。 我目前拥有的是这个
$raw_text = file_get_contents( 'http://www.booking.com/reviews/es/hotel/royal.html?aid=304142;sid=56e38d55a38ec2df6fe4622827e89675;dcid=1' );
$rm_html = strip_tags($raw_text);
如何删除所有类型的标签,只保留当前页面中的文本?
【问题讨论】:
-
页面的“内容”到底是什么意思?
-
strip_tags 不起作用?
-
@arkascha 我只想要其中的文本,以便稍后处理
-
@Jeremy Thille 仅删除 HTML 标签。它仍然在其中获取 js
-
不熟悉PHP,但是可以使用正则表达式来获取标签内的所有内容吗?
标签: javascript php jquery html css