• 课程结构
    第八讲_图像问答Image Question  Answering
  • 图像问答的描述
    第八讲_图像问答Image Question  Answering
  • 具备一系列AI能力:细分识别,物体检测,动作识别,常识推理,知识库推理.....
  • 先要根据问题,判断什么任务
  • 图像问题与图像描述的关系
    第八讲_图像问答Image Question  Answering
  • 研究的难点和挑战
    第八讲_图像问答Image Question  Answering
  • 研究方向
    第八讲_图像问答Image Question  Answering

数据集

  • COCO-QA来源MSCOCO
  • VQA(visual question answering)
  • 平衡数据集V1.9-->V2.0
  • Visual7W---Visual Genome的子集

图像问答模型

  • 模型
    第八讲_图像问答Image Question  Answering
  • 基本都是VGG-Net和ResNet,LSTM模型
  • LSTM:三个门和记忆状态
    第八讲_图像问答Image Question  Answering
  • 基本模型
    第八讲_图像问答Image Question  Answering
    第八讲_图像问答Image Question  Answering

模型增强:注意机制

  • 基本模型
    第八讲_图像问答Image Question  Answering
    第八讲_图像问答Image Question  Answering

模型增强:外部知识库

  • 基本模型
    第八讲_图像问答Image Question  Answering
  • 属性预测模型

相关文章:

  • 2021-11-26
  • 2022-12-23
  • 2022-12-23
  • 2022-12-23
  • 2021-05-31
  • 2021-05-30
  • 2022-02-09
  • 2021-06-09
猜你喜欢
  • 2021-08-04
  • 2021-11-29
  • 2021-09-07
  • 2021-08-15
  • 2022-01-10
  • 2022-01-05
  • 2021-04-24
相关资源
相似解决方案