【问题标题】:Pass image to Tesseract.js OCR将图像传递给 Tesseract.js OCR
【发布时间】:2016-04-26 16:30:15
【问题描述】:

您可以找到我所指的 Tesseract JS Wrapper here

我们想要完成的事情:

  • 上传打印文件的照片
  • 把照片变成文字

到目前为止设置完成的事情:

  • npm install tesseract.js

这是我们的代码:

HTML

<input id="myFileInput" type="file" accept="image/*;" capture="camera">

<img id="pic" src="rec.jpg">

JS

<script src="http://tenso.rs/tesseract.js"></script>

<script type="text/javascript">

var img = document.getElementById("pic");

Tesseract
  .recognize( img, {
    progress: show_progress} )
  .then( display )

</script>

控制台中发生了什么:

“未捕获的 ReferenceError:未定义 show_progress”

“你好”,

"pre-main prep time: 67 ms",


如您所见,我们暂时放弃了照片上传功能,直到我们弄清楚如何让 tesseract.js 为单个预先提供的 jpg 文件工作。最终,我们希望添加此功能。

任何帮助都将不胜感激,我们这样做是为了好玩,主要是寻求一种简单(但有效)的方法来使用 JavaScript 进行 OCR。如果您有其他建议,请告诉我们!

【问题讨论】:

  • 您可能希望将结果与Google Cloud Vision API 进行比较。
  • 根据user993553给出的答案,需要调用一个函数进行进度:.或者你需要为 show_progress 写一个函数。

标签: javascript ocr tesseract


【解决方案1】:

https://github.com/naptha/tesseract.js/blob/a6195ef86d9673cab26120613f53c499b8ec0994/example.htm看来,show_progress 必须是一个函数。

Tesseract.recognize(canvas,{
        tessedit_char_blacklist:'e',
        progress: function(e){
            console.log(e)
        }

【讨论】:

    【解决方案2】:

    这是我的代码:

    Tesseract.recognize("https://yoursite/image.jpg", {
        lang: 'ind',
        tessedit_char_blacklist: 'e'
    })
    .progress(function(message){ console.log(message) })
    .then(function(result) { console.log(result) });
    

    在识别函数后面加上progress(function(message){ console.log(message) }) 它非常适合我。

    【讨论】:

      猜你喜欢
      • 2016-07-28
      • 2013-05-06
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-08-04
      相关资源
      最近更新 更多