【发布时间】:2015-12-10 22:25:41
【问题描述】:
我可以使用 XML 解析器解析 HTML 文件吗?
为什么我不能(不能)这样做。我知道 XML 用于存储数据,而 HTML 用于显示数据。但在语法上它们几乎相同。
预期用途是制作 HTML 解析器,它是网络爬虫应用程序的一部分
【问题讨论】:
-
只要您的 html 是严格的 XML(例如 XHTML 1.0),您就可以这样做。否则,HTML 不是严格意义上的 XML,因此解析器会引发错误。
标签: html xml parsing html-parsing