【发布时间】:2014-08-20 16:14:35
【问题描述】:
我想以编程方式使用 C# 为大学项目提取 PDF 文档中的表格。我对itextsharp很熟悉。
-
有没有办法提取
itextsharp中的表格? -
有没有其他免费的图书馆可以用于此目的?
-
我可以将
PDF转换为XML/HTML 以提取<table>标记吗?如果可以,我可以使用免费库将PDF转换为HTML 吗?或
请给我一个合适的解决方案..
【问题讨论】:
-
您查看过他们网站上的
ITextSharp's文档/示例吗? -
是的,到目前为止,我在 itextsharp 中找不到这样做的方法,因为表格主要是文本数据。我们无法区分表格数据和 itextsharp 中的文本数据。
标签: c# pdf itextsharp pdf-to-html