Tidy可以用来解析、格式化HTML,是一个出色的HTML解析引擎,它最初设计的目的是用来自动修正HTML中的错误和松散的标签。
Tidy项目可以访问(
1. Tidy最初的设计者Raggett关于它的详细介绍;
(
2. 技巧: 用 HTML Tidy 将 HTML 转换成XML ;
(
3. JTidy 是 HTML Tidy用Java实现的移植版本,提供了一个HTML的语法检查器和很好的打印功能,上一次更新的时间是2001年8月
(
4. Ntidy是在Tidy基础上的.Net封装,上一次更新的时间是2004年1月
(
1. NekoHTML是一个简单地HTML扫描器和标签补偿器(tag balancer) ,使得程序能解析HTML文档并用标准的XML接口来访问其中的信息。上一次更新的时间是2008年12月29日!(注:NekoHTML是java开源项目)
(
2. Html2xhtmlCleaner能够将HTML转换成合法的XHTML文件,它还提供标签和属性过滤。它是codeproject上的.Net开源项目。
(