【发布时间】:2011-04-19 14:15:41
【问题描述】:
我处于经典场景中,企业为您提供了一堆新的 pdf 格式的新年表格,没有任何修订说明,您应该弄清楚与前一年的不同之处.
我在这里谈论大量表格,因此我试图找到一种方法来比较 PDF 以概述差异,而无需人们手动浏览每一个表格。
我的想法是从 PDF 中提取所有文本并将其转储到 .txt 中,然后在文本文件上运行差异,但这听起来很糟糕。
我的问题是以编程方式提出的,但我很乐意使用任何可靠的工具来比较 PDF,主要是希望从人们的经验中获得灵感。也愿意接受任何程序化解决方案(最好使用 C#,但请提出任何想法)。
【问题讨论】:
-
为什么是重复的?显然,所问的问题是关于如何以编程方式进行。任何数量的可安装工具都不是这个问题的答案。
标签: c# language-agnostic pdf file-comparison