【发布时间】:2014-03-11 05:39:21
【问题描述】:
需要从 html 文件中删除所有 web 内容,只保留 HTML 标签。
可以通过正则表达式或 JavaScript 来完成吗?
之前:
<html>
<head>
<title>Ask a Question - Stack Overflow</title>
<link rel="shortcut icon" href="//cdn.sstatic.net/stackoverflow/img/favicon.ico">
<script type="text/javascript">
document.write("Code remains un-touched");
</script>
</head>
<body class="ask-page new-topbar">
<div id="first">ONE</div>
<div id="sec">TWO</div>
<div id="third">THREE</div>
</body>
</html>
之后:
<html>
<head>
<title></title>
<link rel="shortcut icon" href="//cdn.sstatic.net/stackoverflow/img/favicon.ico">
<script type="text/javascript">
document.write("Code remains un-touched");
</script>
</head>
<body class="ask-page new-topbar">
<div id="first"></div>
<div id="sec"></div>
<div id="third"></div>
</body>
</html>
更新: 需要使用以后的 HTML 标签,在剥离 web-content 之后,应该显示 html。最后,我对 HTML 代码感兴趣。
【问题讨论】:
-
您需要检查每个元素是否有内容,如果是,请删除它,
-
工具可以是任何东西。
-
@j08691 :无论如何,没问题。
标签: javascript html regex