【发布时间】:2011-06-09 22:33:58
【问题描述】:
我是 PHP 新手。有人可以帮我弄清楚如何抓取单个 html 页面并打印该页面源代码中的所有单词吗?
【问题讨论】:
-
“打印该页面源代码中的所有文字”是什么意思?
-
我的意思是 .. 解析页面正文并打印所有长度超过 3 ..
-
定义词?你在谈论文本中的单词吗?标签?这很混乱
-
PHP.net 有一些关于如何使用 PHP @php.net/manual/en/book.dom.php 导航 DOM 的好资料
-
当您说“页面正文”时,您的字面意思是
<body>标签之间的内容吗? HTML 标记是否算作“所有单词”的一部分?