【发布时间】:2017-05-09 12:46:14
【问题描述】:
我正在尝试开发一个需要知道图像中标记对象的位置的应用程序。仅知道图像中有“钢琴”是不够的,我需要知道该钢琴在图像中的位置。
Microsoft 的 Computer Vision API 和 Google 的 Cloud Vision API 都提供某种形式的裁剪建议/智能缩略图生成服务,这让我认为某些对象的位置正在被检测到 - 但是有没有办法获取该信息(例如来自 Microsoft 的计算机视觉 API 或 Google 的 Cloud Vision API 的每个检测到的对象周围的边界框?
编辑:我知道这两个 API 都可以返回在图像中检测到的人脸的位置,但是我正在寻找图像中每个对象的位置和大小:汽车、钢琴、树木、人...任何东西。
【问题讨论】:
标签: api computer-vision microsoft-cognitive google-cloud-vision