【发布时间】:2012-09-10 07:04:03
【问题描述】:
我正在寻找用于文档预处理的库(和指南)。我的意思是,例如生成 PDF、MS Office (Excel/Word)、Open Office 格式文件。
我看到有特别流行的 Apache POI 和 iText。 你知道任何描述文档预处理库的书吗(对于 iText,我找到了“iText in Action”)?
我也想比较库。
有什么线索吗?
【问题讨论】:
标签: itext apache-poi java
我正在寻找用于文档预处理的库(和指南)。我的意思是,例如生成 PDF、MS Office (Excel/Word)、Open Office 格式文件。
我看到有特别流行的 Apache POI 和 iText。 你知道任何描述文档预处理库的书吗(对于 iText,我找到了“iText in Action”)?
我也想比较库。
有什么线索吗?
【问题讨论】:
标签: itext apache-poi java
对于文件格式本身,许多详细信息都可以在线获得。没有我知道的书。但这里有一些对一些办公文档文件格式的在线参考。
对于 Microsoft Office 文档(Word、Excel、PowerPoint),发布的格式 http://www.microsoft.com/openspecifications/en/us/programs/osp/office-file-formats/default.aspx 或者 http://msdn.microsoft.com/en-us/library/cc313105%28v=office.12%29.aspx
Microsoft 网站包含一些如何解析 Office 类型文件的示例,可能对您有用。
对于开放式办公室,您可以查看 http://www.openoffice.org/xml/general.html 或者 https://www.oasis-open.org/committees/tc_home.php?wg_abbrev=office
但以上内容更像是参考手册,而不是让您轻松解析这些文档的教程或库。
【讨论】: