【发布时间】:2016-04-26 16:30:15
【问题描述】:
您可以找到我所指的 Tesseract JS Wrapper here。
我们想要完成的事情:
- 上传打印文件的照片
- 把照片变成文字
到目前为止设置完成的事情:
npm install tesseract.js
这是我们的代码:
HTML
<input id="myFileInput" type="file" accept="image/*;" capture="camera">
<img id="pic" src="rec.jpg">
JS
<script src="http://tenso.rs/tesseract.js"></script>
<script type="text/javascript">
var img = document.getElementById("pic");
Tesseract
.recognize( img, {
progress: show_progress} )
.then( display )
</script>
控制台中发生了什么:
“未捕获的 ReferenceError:未定义 show_progress”
“你好”,
"pre-main prep time: 67 ms",
如您所见,我们暂时放弃了照片上传功能,直到我们弄清楚如何让 tesseract.js 为单个预先提供的 jpg 文件工作。最终,我们希望添加此功能。
任何帮助都将不胜感激,我们这样做是为了好玩,主要是寻求一种简单(但有效)的方法来使用 JavaScript 进行 OCR。如果您有其他建议,请告诉我们!
【问题讨论】:
-
您可能希望将结果与Google Cloud Vision API 进行比较。
-
根据user993553给出的答案,需要调用一个函数进行进度:.或者你需要为 show_progress 写一个函数。
标签: javascript ocr tesseract