将图像传递给 Tesseract.js OCR答案

【问题标题】：Pass image to Tesseract.js OCR将图像传递给 Tesseract.js OCR
【发布时间】：2016-04-26 16:30:15
【问题描述】：

您可以找到我所指的 Tesseract JS Wrapper here。

我们想要完成的事情：

上传打印文件的照片
把照片变成文字

到目前为止设置完成的事情：

npm install tesseract.js

这是我们的代码：

HTML

<input id="myFileInput" type="file" accept="image/*;" capture="camera">

<img id="pic" src="rec.jpg">

<script src="http://tenso.rs/tesseract.js"></script>

<script type="text/javascript">

var img = document.getElementById("pic");

Tesseract
  .recognize( img, {
    progress: show_progress} )
  .then( display )

</script>

控制台中发生了什么：

“未捕获的 ReferenceError：未定义 show_progress”

“你好”，

"pre-main prep time: 67 ms",

如您所见，我们暂时放弃了照片上传功能，直到我们弄清楚如何让 tesseract.js 为单个预先提供的 jpg 文件工作。最终，我们希望添加此功能。

任何帮助都将不胜感激，我们这样做是为了好玩，主要是寻求一种简单（但有效）的方法来使用 JavaScript 进行 OCR。如果您有其他建议，请告诉我们！

【问题讨论】：

您可能希望将结果与Google Cloud Vision API 进行比较。
根据user993553给出的答案，需要调用一个函数进行进度：.或者你需要为 show_progress 写一个函数。

标签： javascript ocr tesseract

【解决方案1】：

从https://github.com/naptha/tesseract.js/blob/a6195ef86d9673cab26120613f53c499b8ec0994/example.htm看来，show_progress 必须是一个函数。

Tesseract.recognize(canvas,{
        tessedit_char_blacklist:'e',
        progress: function(e){
            console.log(e)
        }

【讨论】：

【解决方案2】：

这是我的代码：

Tesseract.recognize("https://yoursite/image.jpg", {
    lang: 'ind',
    tessedit_char_blacklist: 'e'
})
.progress(function(message){ console.log(message) })
.then(function(result) { console.log(result) });

在识别函数后面加上progress(function(message){ console.log(message) }) 它非常适合我。

【讨论】：