【问题标题】:java parse html + css and convert the output to different langjava解析html + css并将输出转换为不同的语言
【发布时间】:2010-11-05 23:04:39
【问题描述】:

我需要了解 html + css 文件并将其转换为 java 中的 rtf layot 之类的东西 现在我明白我需要某种 html 解析器,但我需要从那里做什么? 我如何实现 html-css 转换器?是否有某种模式或方法 适合这样的工作吗?

【问题讨论】:

  • html-css 转换器是什么意思?在大多数情况下,您最好使用支持两种文件类型的编辑器进行转换。
  • 我不认为他/她的意思是从html转换为css,而是将css样式的html转换为rtf。至少我是这么读的。
  • 这和渲染 HTML+CSS 有什么不同吗?
  • 其 html css 样式文件转换为 rtf 格式
  • 如果您不需要 100% 正确的翻译,请尽可能使用 Google 翻译器的网页翻译功能。否则请使用其他人建议的其他方法。

标签: java html-parsing converter


【解决方案1】:

我会做以下事情:

  1. 最初使用JTidy转换HTML 有效的 XHTML
  2. 将 XSLT 应用到 转换为 RTF 使用 XML 库,如 Saxon 或 Xerces

注意:虽然我没有 直接找到那个转换的xsl文件我是 肯定有一个地方

【讨论】:

  • XSLT 不会考虑 HTML 文档的 CSS 样式。 (或者会吗?我可能错了。)
  • @Andrew Duffy:如果没有,那就是一个糟糕的 xslt。尽管外部 css 有问题,但您可以下载它并将其内联插入到文档中以进行转换。
  • @Andrew Duffy:当然你是对的,它不会,因为 css 不是 xml...愚蠢的我...我去休息一下 ;-)
【解决方案2】:

您应该查看 HTMLEditorKit。它为 CSS 渲染提供了一些支持。还有一个用于编写的 RTFEditorKit,虽然它并不完全可靠(我上次检查,几年前)。

您是否有理由需要使用 Java 而不是仅在 Word(或其他编辑器)中加载 HTML 并将其保存为 RTF?还要检查this W3C link

【讨论】:

  • 它必须是批处理文件需要处理分配文件的东西
  • 该链接指向许多无头转换器——您可能想查看它们。
【解决方案3】:

The Flying Saucer Project 可以让您将 XHTML 渲染为 PDF。也许可以使用它来代替 RTF,或者生成的 PDF 可以转换为 RTF?

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2015-10-13
    • 1970-01-01
    • 2013-01-17
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多