【发布时间】:2011-04-12 00:54:44
【问题描述】:
我的原始来源是 HTML,不是格式良好的 XHTML。更糟糕的是,我将不得不清理并将 html 转换为 xhtml,然后喂飞碟。
【问题讨论】:
标签: java pdf flying-saucer
我的原始来源是 HTML,不是格式良好的 XHTML。更糟糕的是,我将不得不清理并将 html 转换为 xhtml,然后喂飞碟。
【问题讨论】:
标签: java pdf flying-saucer
飞碟不支持 HTML;正如其website 中所述:“不支持旧版 HTML(尽管有几种不同质量的开源 Java HTML 清理器可用)。”不过,您可以尝试他们建议的一种 HTML 清理程序。毫无疑问,最好的之一是HtmlCleaner。
【讨论】:
飞碟用户指南回答了我的问题。
Flying Saucer 是一个 XML/CSS 渲染器, 这意味着它将 XML 文件作为 输入,应用格式和样式 使用 CSS,并生成一个渲染的 将该 XML 表示为输出。 输出可能会显示在屏幕上(在 GUI)、图像或 PDF 文件。 因为我们相信大多数人会 有兴趣重用他们的知识 网页布局,我们的主要目标是 内容是 XHTML 1.0(严格),一个 XML 标准化的文件格式 HTML。但是,我们接受任何 格式良好的 XML,可长时间渲染 因为提供了 CSS,它告诉我们如何 把它摆出来。在 XHTML 的情况下, 提供了默认样式表 盒子和包装内 图书馆,这意味着飞碟可以 开箱即用地呈现大多数 XHTML 不错的结果。
【讨论】: