【发布时间】:2013-09-16 00:11:11
【问题描述】:
我用 C 语言创建了一个程序,它将读取文件的内容,然后将其输出到一个新文件中。但是,我需要扩展这个程序以跳过 HTML 标记。有人能指出我应该做什么或应该怎么做的正确方向吗?
我所知道的只是分别跳过字符,但我如何跳过它以包容性地跳过“”中的所有内容?
如果可能,请不要给我完整的代码,因为这是作业,我想从中学习。
谢谢!
【问题讨论】:
-
有一个标志,指示您是否需要保留符号。如果 character=="" 则将其更改为 false。
-
唯一真正正确的答案是“使用 HTML 解析器”。任何复杂到足以可靠地导航极端情况的解决方案都将比它的价值更麻烦,而且你基本上只拥有 HTML 解析器的硬半部分。