【发布时间】:2011-04-07 09:38:35
【问题描述】:
我在 var 中有这段代码。
<html>
<head>
.
.
anything
.
.
</head>
<body anything="">
content
</body>
</html>
或
<html>
<head>
.
.
anything
.
.
</head>
<body>
content
</body>
</html>
结果应该是
content
【问题讨论】:
-
@marcgg 的意思是你不能用正则表达式解析 HTML。
-
出于某种原因,这个问题每小时都会被问一次。因此他感到沮丧。
-
问题不在于解析 HTML - 它是关于提取 BODY 的内容
-
@michael,不同的任务,啊哈。
-
所以我来到这里是因为我也已经到了想要使用正则表达式的地步。到目前为止,我使用 DOMParser 做得很好。原因:Chrome 非常担心我可能会丢失命名空间,所以它会在我使用 innerHTML 提取正文的那一刻为所有内容添加一个 xmlns 属性。我不想要那个。否则我找不到任何方法来说服它:-(
标签: javascript html regex