【发布时间】:2016-05-14 15:21:54
【问题描述】:
我能够从幽灵脚本中提取文本,并且能够一次比较文本的短语。然而问题是幽灵脚本以一种时髦的方式输出文本。我正在寻找按元素(表格、文本、图像)比较元素。我正在寻找一个自动化的解决方案来做到这一点。我正在寻找 Itextsharp 但找不到任何文档。
我最大的挑战是遍历元素并将它们与两个 PDF 中的元素进行比较。
有人可以帮忙吗?
【问题讨论】:
-
比较文件非常复杂。我建议你找一个第三方库。
-
您在寻找使用 c# 还是 python 的解决方案?
-
我正在寻找任何一个的解决方案。我花了几天时间尝试不同的图书馆,但仍然没有运气。他们中的大多数是有偿的。任何帮助深表感谢。提前谢谢你。
标签: c# python-2.7 pdf highlight