【问题标题】:Word Doc File to JSON [closed]Word Doc 文件到 JSON [关闭]
【发布时间】:2014-10-30 14:31:58
【问题描述】:

我将解析 ms word 格式的文档并将其转换为 JSON(或最终通过 XML 转换为 JSON)。这种解析和转换将如何处理嵌入在 word doc 中的图像。这些图像如何以 json 格式表示。任何指针或演示示例。

我正在考虑使用 apache poi 作为解析器并为 json 字符串生成器定制 java 类。

有没有现成的工具可以进行这种解析和转换。

【问题讨论】:

  • 您的问题没有包含足够的详细信息,无法回答。
  • @MatthiasSteinbauer 唉!!......有人刚刚回答......伙计..我从汤姆·戈兹那里得到了答案

标签: java json base64 apache-poi doc


【解决方案1】:

只是.zip这个word文件,.docx文件不过是xml的集合。打开 .zip 文件后,您会找到 xml 文件。然后通过 google feed API 将您的 xml 文件转换为 json。

【讨论】:

  • 您能提供更多信息吗?也许是指令?
  • 在 7z 中打开你的 docx 文件
  • 然后你会看到一个word文件夹,打开它。然后你会看到一个 document.xml 现在这是你的 .xml 格式的 ms word 数据
【解决方案2】:

尝试将 MS Document 转换为 Base64(ASCII 字符序列)并通过 JSON 或 XML 将其作为字符串发送。然后就可以解码了,文件应该是一样的(内嵌图片)。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2010-12-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多