【问题标题】:Extract particular data fields from a scanned document in java从java中的扫描文档中提取特定数据字段
【发布时间】:2016-01-29 06:52:57
【问题描述】:

如何在java中从扫描的文档中提取特定的数据字段?例如:在扫描的文档中,有类似的字段;

            Name  : ABC 
            Place : XYZ 

现在我们需要获取值 ABC,XYZ 并复制到我们的 java 变量中。 请帮我解决这个问题。

【问题讨论】:

  • 试试正则表达式
  • 什么样的文件?您在寻找 OCR 库吗?
  • 是的,但在这种情况下哪个是最好的 OCR
  • 请提供详细信息。

标签: java field ocr document extraction


【解决方案1】:

你可以使用 java.util.Properties:

    Properties p = new Properties();
    p.load(new StringReader(data));
    String name = p.getProperty("Name");
    String place = p.getProperty("Place");

【讨论】:

  • 谢谢,那真的很有帮助。但是你能推荐一种将扫描文档(主要是图像格式或pdf)转换为字符串的最佳方法吗?
猜你喜欢
  • 2015-03-19
  • 1970-01-01
  • 1970-01-01
  • 2010-12-17
  • 1970-01-01
  • 2017-04-02
  • 2013-01-28
  • 2019-08-12
  • 1970-01-01
相关资源
最近更新 更多