【问题标题】:model for hand written text recognition手写文本识别模型
【发布时间】:2020-06-26 20:38:05
【问题描述】:

我一直在尝试创建一个模型,给定图像,可以从中读取文本。我试图通过实现 cnn、rnn 和 ctc 来做到这一点。我正在使用 TensorFlow 和 Keras 执行此操作。有几件事我很困惑。对于读取个位数,我知道模型中的最后一层应该有 9 个节点,因为这些是选项。但是,对于阅读单词,没有无限多的选项,所以我的最后一层应该有多少个节点。此外,我对如何将我的 ctc 添加到我的 Keras 模型感到困惑。是作为损失函数吗?

【问题讨论】:

  • 您应该查看 OCR。它很可能不仅仅是您需要的单一模型。您的数字识别器中还应该有 10 个节点,不要忘记 0。

标签: python tensorflow machine-learning keras


【解决方案1】:

我在这里看到两个选项:

  1. 您可以构建模型以识别这些单词的单独字母,然后在最后一层中的节点数与模型将读取的字母表中的字母和符号一样多。
  2. 您可以将模型输出为向量,然后使用其他可以将单词编码/解码为向量的工具“解码”该向量。我能想到的一个这样的工具是 word2vec。或者可以选择下载一些可能的单词数据库并自己创建这样的工具。
    你的模型描述很模糊。如果您想获得更具体的帮助,那么您应该提供更多信息,例如一些模型架构。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2019-12-09
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-01-24
    • 2015-02-28
    • 1970-01-01
    相关资源
    最近更新 更多