【问题标题】:How to recognize and count objects with Firebase / ML Kit如何使用 Firebase / ML Kit 识别和计数对象
【发布时间】:2021-01-03 03:19:54
【问题描述】:

我想识别和计算图片中的物体,例如数一数邻里图片中的房屋数量。使用 ML Kit 执行此操作的最佳方法是什么?

我需要使用Object Detection API吗?或者是否有可能使用直接的图像标签获得多个“房子”标签?

【问题讨论】:

    标签: firebase-mlkit object-recognition google-mlkit


    【解决方案1】:

    ML Kit Object Detection API(请注意,它现在作为独立 SDK 提供)可以对图像/视频流中的对象进行计数,但仅限于 5 个最大的对象。此外,您应该评估对象检测是否适用于您的用例。它是一个非常通用的定位器,适用于大多数对象,但是当对象靠近/重叠时,它可能无法区分它们。

    如果您需要检测超过 5 个对象,我建议您直接使用 TensorFlow LiteTF Hub 上提供的一些预训练模型进行查看,或者如果一般模型没有,则使用 AutoML Vision Edge 自己训练一个不适合您的用例。

    Fwiw,图像标签分配描述图像场景的标签。但是,它不计算对象的数量,您通常会得到一个标签“房子”。

    【讨论】:

    • 是否可以使用 MLKit 获取检测到的对象的 3D 坐标?还是需要像 ARCore 这样的额外 API?
    猜你喜欢
    • 2020-09-24
    • 2021-06-04
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-02-06
    • 1970-01-01
    • 2018-12-12
    • 2019-09-23
    相关资源
    最近更新 更多