【问题标题】:SGML parser .NET recommendations [closed]SGML 解析器 .NET 建议 [关闭]
【发布时间】:2009-07-18 17:32:16
【问题描述】:

在我的 C# 项目中,我处理了解析 SGML 文件的任务,并且非常天真地尝试使用 XmlReader,这导致了一些有趣的启示(即 SGML 和格式良好的区别XML等)

所以我认为我只需要一个好的 SGML 解析器,它将它转换为 XML 文件并从那里开始。在我的搜索中,我发现了两个可以与我的 C# 项目集成的 SGML 解析器:

还有其他建议吗?

【问题讨论】:

  • 我很好奇。我不知道amyone 还在使用SGML。干什么用的?
  • Avid INEWS avid.com/solutions/808.htm 使用称为新闻故事标记语言 (NSML) 的基于 SGML 的标记来存储和表达故事信息。我可以从 Avid 的观点看出他们为什么使用 SGML,但那是另一个故事(不是双关语)。
  • SEC 的 EDGAR 系统使用 SGML 来标记向 SEC 报告的情况。
  • James Clarks SP 包已过期。几年前,它和他的 JADE 程序一起变成了an Open Source project
  • 你在这方面有什么进展吗?我有完全相同的任务,但使用 Java,我发现它是一个绝对的噩梦,试图让它工作!

标签: c# .net sgml


【解决方案1】:

显然 SgmlReader 在这里更新了:

https://github.com/MindTouch/SGMLReader

【讨论】:

  • 别忽视:MindTouch 重新组织了自己,但如果您点击链接,然后搜索 SgmlReader 并继续搜索,直到找到整个 MindTouch 套件的下载,包含 SgmlReader。哇!
  • 我在使用他们的库时遇到了问题,但不幸的是,他们的 GitHub 项目页面只允许拉取请求而不是提交问题。上一次提交是几年前的事了——我对将精力投入到可能被忽略的贡献上持谨慎态度。
【解决方案2】:

HTML 是 SGML 的一种实现。如果您想正确解析 HTML,您将需要一个 SGML 解析器。 SGMLreader 似乎很好地满足了这些需求,我打算自己使用它。我建议使用 HTML tidy。它是一个本地应用程序,但它的 .net 绑定确实存在。如果您需要完全托管的代码,那么 SGMLreader 是您的最佳选择。

【讨论】:

  • 同意。从那以后我一直在使用 SgmlReader,它运行良好。
猜你喜欢
  • 2012-09-25
  • 2011-06-19
  • 1970-01-01
  • 1970-01-01
  • 2012-08-23
  • 1970-01-01
  • 1970-01-01
  • 2010-10-25
  • 1970-01-01
相关资源
最近更新 更多