【问题标题】:How to optimize the HTML text copied from MS Word with GWT?如何使用 GWT 优化从 MS Word 复制的 HTML 文本?
【发布时间】:2012-08-13 23:23:38
【问题描述】:

我遇到了RichTextAreas 的问题,所以我的问题是: 当我将 Word 或 OpenOffice 中复制的文本粘贴到 RichTextArea 中时,它会保留所有文本样式,这是完美的,但一件坏事是它的 HTML 文本足够大:(。 由于不必要的 HTML 标签,数据库的大小增加了。

我的问题是:“如何轻松优化 HTML 文本?”

谢谢!!!

【问题讨论】:

    标签: java gwt richtextbox copy-paste


    【解决方案1】:

    RichTextArea 基于浏览器的contentEditable 支持。这意味着您最终将使用的 HTML“标签汤”将是平台、源和浏览器特定的。当您说“优化”时,您的最终目标是什么?您想保留多少原始格式?除了对粘贴的 HTML 进行微不足道的缩小之外,HTML 复杂性的任何显着降低都可能导致视觉保真度的损失。

    HTML Tidy 等实用程序或其任何衍生工具可能会在缩小方面为您提供帮助。如果您的目标是降低 HTML 的复杂性,您可能会考虑使用 HTMLUnit 作为强制服务器端浏览器来在内存中呈现粘贴的内容,然后从 HTMLUnit 的 DOM 中提取您认为有用的属性。 FWIW,这是使 AJAX 应用程序可被搜索引擎抓取的一种方法。

    虽然降低视觉保真度可能会让原始用户感到有些不安,但它确实为您提供了统一所有粘贴内容的视觉风格的机会。如果您正在根据许多用户的贡献来构建网站,那么这种同质性会减少定位(即看到您所看到的内容)所需的脑力劳动量。

    【讨论】:

      【解决方案2】:

      最后,我找到了自己问题的答案: 我发现TinyMCE for GWT 对我来说已经足够好了,它有从 ms word 复制的选项,而且它的 HTML 优化非常好。

      【讨论】:

        【解决方案3】:

        Related question

        Html Tidy 有一个可以在 Java 程序中使用的 API。

        【讨论】:

          猜你喜欢
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 1970-01-01
          • 2012-04-20
          • 2011-10-06
          • 2014-08-29
          • 1970-01-01
          • 2012-11-13
          相关资源
          最近更新 更多