【问题标题】:What is the most suitable classification algorithm to classify legal document pictures?什么分类算法最适合对法律文件图片进行分类?
【发布时间】:2011-09-22 16:02:22
【问题描述】:

我在多个国家/地区拥有一组文件,例如(身份证明、驾驶执照和护照等),因此我需要将它们分别归类,然后我可以对任何新文件进行分类 - 不在我的集合中 -在同类中。

文档可能会旋转或移动或两者兼而有之。 同一类的两个文档的文档颜色可能不完全相同。

最好的算法是什么?

【问题讨论】:

    标签: c# .net artificial-intelligence


    【解决方案1】:

    问题不在于选择哪种分类算法,而是要了解分类问题中所有相关的隐藏维度。一旦您了解了所涉及的所有维度,您就可以使用任何一种分类算法来实现您想要的。

    【讨论】:

    • 您是对的,但您认为主要的维度是什么?我想到了直方图、纹理、大小和其他一些特征。你怎么看?
    • 不幸的是,主要维度是问题空间的函数。我将从一组详尽的维度(我能想到的所有......)开始,并使用一些监督算法对其进行训练。然后我将在输入数据中引入随机变化并测量性能差异。
    • 我建议使用图像处理食谱。这是一本非常好的初学者指南。 amazon.com/Image-Processing-Cookbook-processing-scientific/dp/…
    【解决方案2】:

    正如其他人所提到的,这不是一个真正的分类问题。此外,由于您的项目可能会旋转、倾斜等,因此您确实应该对图像执行某种对象检测/特征分析。

    我建议您查看perceptual hashingSpeeded Up Robust Features (SURF)(如果您要处理大量旋转/倾斜,则更多是后者)。也就是说,我会将图像分解为无法识别的区域(例如,您将消除包含用户信息或他们的照片的区域)集中在具有大量匹配特征点的区域。

    使用在特定 ID 类的所有实例中一致的区域,以便您的匹配分数更高,然后汇总您比较的所有部分以执行分类。

    【讨论】:

      【解决方案3】:

      分类算法有几十种,甚至上百种——基本上您要寻找的是聚类。

      http://en.wikipedia.org/wiki/Cluster_analysis

      要完成这项工作,您必须分析文档并将其归结为几个关键数字。这不一定是完美的集群才能工作。

      因此,进行某种规范化(旋转所有文档以使文本是水平的)可能会很好,但也许不是。例如,如果一个关键分类号是基于整体颜色的——这对于任何轮换都是一样的。

      【讨论】:

      • 但是类是已知的,聚类是用来确定类的,据我所知!
      • 您认为我应该从文件中收集哪些主要特征或关键数字?
      • 与已知类类似:只测量已知和未知之间的距离。关键仍然是提出计算距离的参数。它是特定领域的,所以很难给出建议。如果不能旋转,则需要选择不考虑旋转的相同的东西。如果你可以旋转,那就更好了——OCR(例如 Tesseract)可以帮助你做到这一点(尝试所有四种旋转 0、90、180、270)——这给你最真实的词就是可能的词。如果您知道高度与宽度的比率(检查是否颠倒),您也许可以缩小范围。
      猜你喜欢
      • 2015-06-30
      • 2019-03-06
      • 2011-07-05
      • 2011-05-21
      • 2017-07-10
      • 2018-03-31
      • 2018-08-24
      • 1970-01-01
      • 2011-05-19
      相关资源
      最近更新 更多