【问题标题】:Automation of PDF report verificationPDF 报告验证自动化
【发布时间】:2012-11-22 23:47:21
【问题描述】:

在我们的团队中,我们需要验证从应用程序生成的 pdf 报告。这些报告因客户而异。

是否有任何自动化工具可以在没有任何人工干预的情况下比较这些报告?

我们希望根据预期的输出内容验证​​ pdf 文档中的每个元素。

【问题讨论】:

  • 您使用哪种编程语言?为什么要这样做?这将是帮助者以更好的方式帮助您的起点。
  • 你说的是真的吗?您想以某种方式验证每个元素吗? IE。页面上某处的每个字形,绘制的每条线和位于某处的图像?每一个……?如果是的话,如果您自己创建 PDF 会不会更容易?如果不是,请澄清。
  • @Tahir :我正在使用 Java 语言和 Selenium 测试自动化工具。到目前为止,我是这个项目的新手,还没有尝试过任何东西。但是当我在网上搜索pdf验证自动化的解决方案时,并没有发现任何有用的东西。
  • @mkl:实际上,我的意思是“每个元素”,文本、图像和链接。
  • @user1046367 这实际上是一项艰巨的任务。报告可能有多少不同?它们是否必须以相同的方式创建,在某些位置只有微小的差异?它们是否只需要在给定的 PDF 查看器中看起来相同,在某些位置有细微差别?或者它们甚至可能略有不同(例如,整个文档略微向侧面移动,字体仅部分嵌入,段落重排)?您在搜索中没有找到任何有用的东西的主要原因可能是这样的比较确实不是微不足道的,您必须非常精确地指定您的要求。

标签: pdf automation


【解决方案1】:

基本上,如果您对在 pdf 文件上声明文本感兴趣,请尝试搜索一些 API 或开源库以将 PDF 转换为文本。

一旦将它们转换为文本,就很容易检查它的内容或进行文件比较。

另一种方法是将实际的 PDF 文件与预期的 PDF 文件进行比较。同样,您可以使用一些开源库来比较两个 PDF 文件并判断内容是否匹配。

比较 pdf 文件的另一种方法是比较两个 PDF 文件的校验和。如果相同,则表示实际 PDF 文件与预期的 PDF 文件匹配。

【讨论】:

    【解决方案2】:

    试试 Verifaya Studio,它支持 PDF 自动化,它是免费的,可以从http://studio.verifaya.com下载

    【讨论】:

    • 您的回答指向工具推荐。实际上,这是当今测试自动化行业的十亿美元问题,尤其是在金融领域。我们测试人员需要将从 PDF 中提取的数据转换为记录格式,以便与 DB 比较生成报告的标准。我们有很多工具可以提取 PDF 内容,例如 PDFBox,它可以以一致的方式或 PDF 的内置方式读取文本。我们可以按照用户的方式阅读报告吗?比如提取表格、页眉、页脚、图片等,?
    猜你喜欢
    • 2013-11-12
    • 1970-01-01
    • 1970-01-01
    • 2011-09-21
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2015-08-09
    相关资源
    最近更新 更多