【发布时间】:2020-06-26 20:38:05
【问题描述】:
我一直在尝试创建一个模型,给定图像,可以从中读取文本。我试图通过实现 cnn、rnn 和 ctc 来做到这一点。我正在使用 TensorFlow 和 Keras 执行此操作。有几件事我很困惑。对于读取个位数,我知道模型中的最后一层应该有 9 个节点,因为这些是选项。但是,对于阅读单词,没有无限多的选项,所以我的最后一层应该有多少个节点。此外,我对如何将我的 ctc 添加到我的 Keras 模型感到困惑。是作为损失函数吗?
【问题讨论】:
-
您应该查看 OCR。它很可能不仅仅是您需要的单一模型。您的数字识别器中还应该有 10 个节点,不要忘记 0。
标签: python tensorflow machine-learning keras