【发布时间】:2012-12-14 18:04:37
【问题描述】:
我有一个包含 HTML 数据的字符串变量。现在我想将该 html 字符串拆分为多个字符串,然后最后将这些字符串合并为一个。
这是 html 字符串:
<p><span style="text-decoration: underline; color: #ff0000;"><strong>para1</strong></span></p>
<p style="text-align: center;"><strong><span style="color: #008000;">para2</span> स्द्स्द्सद्स्द para2 again<br /></strong></p>
<p style="text-align: left;"><strong><span style="color: #0000ff;">para3</span><br /></strong></p>
这是我的预期输出:
<p><span style="text-decoration: underline; color: #ff0000;"><strong>para1</strong></span><strong><span style="color: #008000;">para2</span>para2 again<br /></strong><strong><span style="color: #0000ff;">para3</span><br /></strong></p>
我的拆分逻辑如下...
- 根据
</p>标签将HTML字符串拆分成token。 - 并获取第一个令牌并将其存储在单独的字符串变量(firstPara)中。
- 现在获取每个标记,然后删除所有以
<p开头和以</p>结尾的标记。并将每个值存储在单独的变量中。
4.然后取第一个名为 firstPara 的令牌并替换标签 </p>,然后附加我们通过步骤 3 获得的每个令牌。
5.所以,现在变量 firstPara 具有整个值...
- 最后,我们只需在 firstPara 的末尾附加
</p>...
这是我的问题...
你能帮我解决这个问题吗...
【问题讨论】:
-
需要解析html时使用
Html Agility Pack。 -
@TimSchmelter:感谢您为我推荐 Html Agility 包...今天我学到了一个非常有用的...
标签: c# string c#-4.0 string-parsing