删除所有提示并保存到 Acrobat DC 中的指定文件夹?
我正在使用 Adobe AcrobatDC,我需要对文件夹中的多个图像(PNG、EMF、JPEG)进行 OCR。我想出了如何使用“操作向导”创建批处理,它遍历文件夹并创建文本识别的 PDF 文件。我无法弄清楚的唯一功能是如何自动将图像保存到指定的文件夹中。目前,我的自定义操作将在自动化期间提示我并询问我是否“要保存文件”,然后再次提示我“选择目标文件夹”。 问题: 如何使用 Adob... »
我正在使用 Adobe AcrobatDC,我需要对文件夹中的多个图像(PNG、EMF、JPEG)进行 OCR。我想出了如何使用“操作向导”创建批处理,它遍历文件夹并创建文本识别的 PDF 文件。我无法弄清楚的唯一功能是如何自动将图像保存到指定的文件夹中。目前,我的自定义操作将在自动化期间提示我并询问我是否“要保存文件”,然后再次提示我“选择目标文件夹”。 问题: 如何使用 Adob... »
目前我正在寻找一种在图像中查找价格的合适方法。这些图像是彩色的,是用相机或智能手机拍摄的。 我已经做了一些处理,比如颜色阈值、变形。重建和其他步骤来定位和种植价格所在的区域。 现在我想做价格的识别。 在我们的项目中,我们已经尝试了一些 OCR 框架(确切地说是 Tesseract 和 Tessjeract 以及 JOCR),但是对照片中数字的识别非常糟糕。我们还对预处理图像进行了一些实验(颜色... »
所以我正在开发一个可以读取图像文件文本的应用程序,我考虑使用 tesseract.js,但它非常慢。我读到有人说 node-tesseract-ocr 有点快。虽然它需要安装 tesseract-OCR,我已经成功安装并且可以通过命令行访问。我还安装了 node-tesseract-ocr 包,在测试时,我收到了这个错误: 'tesseract' is not recognized as an ... »
我想创建一个应用程序来获取光标下的单词(不仅适用于文本字段),但我找不到如何做到这一点。使用 OCR 非常困难。我见过的唯一工作是 Deskperience 组件。他们支持“本地”方式,但我花了很多钱。现在我试图弄清楚这种“原生”方式是什么(也许是某种挂钩)。任何帮助将不胜感激。 编辑: 我找到了一种方法,但它只获取控件的整个文本。知道如何从整个文本中只获取光标下的单词吗? ... »
我有一个 Pygame 黑色显示器,我将在其上绘制一个白色字母,如下图所示。显示器的尺寸可以是 100x100 像素以上。 我知道我可以使用这样的东西来获取表面二维数组: miSuface = pygame.display.get_surface() miCoso = pygame.surfarray.array2d(miSuface) 但是,我想以某种方式将此数组转换... »
我正在对多位数字的图片进行 OCR。我隔离数字,计算每个数字的七胡不变矩,并存储数据。因此,当我对每个数字都有足够的数据时,我想将一个传入的数字与我已经拥有的数据相匹配。 我首先计算数字的七个 hu 矩,然后检查所有数据并检查其他 hu 矩向量是否与我新到达的数字相匹配。 对于数字 6,七个 hu 时刻可能如下所示: 0.0015019597635929924 8.216737738246... »
如何以正确的方式处理使用tesseract(预处理或通过特殊的tesseract配置)识别字符分隔符内的文本,尤其是梳型(第三张图片),如下面的这三张图片: https://i.stack.imgur.com/Jb5Qd.png https://i.stack.imgur.com/GhzCa.png https://i.stack.imgur.com/rI4c1.png 1) 我尝试对其执行... »
我是 VS2008 的新手,我一直在到处寻找,但找不到任何解决问题的方法。代码如下: private void btnScan_Click(object sender, EventArgs e) { { if (!msgfilter) { this.E... »
我需要识别图像中的文字 (OCR)。我可以在 Python 中使用什么库来从图像中提取文本? 对于 Linux/OSX,检查:OCR on Lin... »
我正在使用 Tesseract 库读取身份证信息。我尝试使用一些Google images 并获得了不错的效果,但是当我使用实时图像时,即从 iPhone 相机捕获图像时,我没有得到很好的效果。 我发现了 Tesseract 建议的一些预处理步骤。 1.修复 DPI(如果需要)最低 300 DPI。 iPhone摄像头实时抓图时如何设置图像的DPI? 2。修正文本大小(例如 12 pt 应... »
我想在某些图像链接上运行 OCR,例如这个:https://i.redd.it/hsop5oo6rb351.jpg。但是,当尝试通过此代码传递此链接时: def ocrImage(image): img = cv2.imread(image) text = pytesseract.image_to_string(img) return text; 控制台返回错误TypeError... »
我基于JavaCV开发OCR系统。 我的项目使用以下库: https://github.com/bytedeco/javacv https://github.com/bytedeco/javacpp-presets/tree/master/tesseract 在一种情况下,我需要找到图像的某个部分并识别其上的字母。 我以 IplImage 类型存储图像的一部分。 但对于 Tessera... »
我已经使用 Anyline 的 trainyourtesseract 成功训练了我的 tesseract,并在我的电子邮件中获得了一个 .traineddata 文件。我可能会在这里问一个愚蠢的问题,但您是否只需将其拖到您的 tessdata 文件夹并交叉手指并希望它有效。没有整合它的方向。我见过将两种不同语言与这样的代码行集成在一起的教程。 G8Tesseract *operation = [... »
我正在尝试从下图中提取电话号码(调整大小后:) 我的代码: from PIL import Image from pyocr import pyocr import pyocr.builders import cStringIO import os os.putenv("TESSDATA_PREFIX", "/usr/share/tesseract-ocr/") tools = pyocr.g... »
我使用的是 Windows 10,tesserocr 版本是 2.4。 想要从图像中检测文本,然后检测该文本的语言。 在运行这段代码时: from tesserocr import PyTessBaseAPI import argparse parser = argparse.ArgumentParser("Enter Image Path") parser.add_argument('-i'... »
我必须创建一个数独求解器,所以我用谷歌视觉创建了一个数字识别,用于从网格中检索数字。这个数字识别修剪网格以分析每个单元格,但识别不起作用。我认为问题来自无法识别单个字符的 TextRecognizer。 你能帮帮我吗? 谢谢。 btnProcess.setOnClickListener(new View.OnClickListener() { @Override ... »
我有一堆看起来类似于这个的预处理表: 玩了一会儿参数,我发现这个命令给了我不错的结果: tesseract my_img.png out -c tessedit_char_whitelist="0123456789.E%-" --psm 6 不幸的是,这还不足以满足我的需求。请注意输出中的某些列是如何没有分开的,并且缺少一些减号。 我可以做些什么来改善结果? 0.015 1.0010... »
我编写了一个 bash 脚本,用于从扫描的 PDF 文件中提取纯文本。我有很多 PDF,但有些是扫描的,有些不是。所以现在我的主要目标是通过检查 PDF 是否已经可搜索来改进我的脚本,因此不需要提取 OCR。 我试过了: pdftext -nopgbrk pdf_file.pdf wordlist 将可能的 OCR 文本存储在 wordlist 中,然后我可以检查它是否为空并确定它是否是可搜... »
我已经安装了 tesseract OCR,它的语言列表中只有 'eng' 和 'osd'。我需要德语。我厌倦了遵循命令 brew install tesseract-ocr-deu 但我遇到了错误。 Error: No available formula with the name "tesseract-ocr-deu" ==> Searching for a previously... »
我已经尝试学习神经网络有一段时间了,我可以在线了解一些基础教程。现在我想使用神经网络开发在线手写识别。所以我不知道从哪里开始?我需要一个很好的指导。最后我是java程序员。 你建议我做什么?... »