【发布时间】:2014-01-27 00:14:26
【问题描述】:
我有原始的 html,里面有一些用于各种标签的 css 类。
例子:
输入:
<p class="opener" itemprop="description">Lorem ipsum dolor sit amet, consectetur adipisicing elit. Neque molestias natus iste labore a accusamus dolorum vel.</p>
我只想得到普通的 html,例如:
输出:
<p>Lorem ipsum dolor sit amet, consectetur adipisicing elit. Neque molestias natus iste labore a accusamus dolorum vel.</p>
我不知道这些类的名称。我需要在 JavaScript (node.js) 中执行此操作。
有什么想法吗?
【问题讨论】:
-
为什么 HTML 有这些类 - 它是从 CMS 或类似的生成的,如果不是,可以从源中删除吗?
-
我想建议您将标题更改为“如何从 HTML 标记中删除所有属性?”因为它实际上似乎与“css 引用”无关,不管它们是什么。
-
在示例中,
itemprop="description"不是 CSS 属性,而是 HTML 元素属性。我猜你想寻找某种 HTML 解析器,因为 HTML 元素有时需要属性(例如<link>和<attr>)。 -
您需要一个 HTML 解析器来将该字符串转换为节点并对其进行解析,例如 cheerio
-
itemprop不是 CSS 类。您只是想删除所有属性吗?此外,某些类可能不仅用于 CSS
标签: javascript html node.js text-processing text-parsing