【发布时间】:2016-07-26 23:20:59
【问题描述】:
许多现实世界的数据集都有多个视图形式的表示。例如,一个人可以通过面部、指纹、签名和虹膜来识别,或者可以通过其颜色和纹理特征表示的图像来识别。多视图基本上是从多个来源获得的信息。在机器学习/数据聚类/计算机视觉的背景下,处理这种方法最相关的应用程序是什么?
【问题讨论】:
标签: machine-learning computer-vision unsupervised-learning
许多现实世界的数据集都有多个视图形式的表示。例如,一个人可以通过面部、指纹、签名和虹膜来识别,或者可以通过其颜色和纹理特征表示的图像来识别。多视图基本上是从多个来源获得的信息。在机器学习/数据聚类/计算机视觉的背景下,处理这种方法最相关的应用程序是什么?
【问题讨论】:
标签: machine-learning computer-vision unsupervised-learning
在计算机视觉的上下文中,多视图是指从不同视图/角度/位置拍摄的同一对象的图像。这种策略有多种应用。 3D reconstruction from multiple view 是最流行的例子之一。
您所指的多视图类型基本上是数据增强来解决单个问题。正如您也提到的,从不同类型的数据源中识别一个人是 data-augmentation 的应用。也可以有多个其他应用程序。例如表情估计,识别一个人的情绪,使用来自 RGB 相机的数据 + 来自 Kinect + 音频的 3D 数据是另一个例子。
在机器学习的背景下,数据增强无处不在。结合图像或音频的不同特征进行分类是数据增强。
【讨论】: