【发布时间】:2009-06-04 14:22:20
【问题描述】:
可以从这些媒体中提取什么样的语义信息?任何事情都可以,无论是区分音乐和语音文本、检测不同的声音(如枪声、鸟儿或汽车)、检测室内/室外拍摄或相机运动的强度。
我知道这个类别中有many、many、many、manymanymany 研究主题,但我没有找到任何应用。是否有人提供有关这些主题的即将推出的产品的应用程序/库/工作原型/新闻的链接?
【问题讨论】:
-
您的意思是像 JPEG 中的 EXIF 信息?
-
不,不是有关媒体的技术信息,而是类似:“这张照片是在户外拍摄的”或“这张照片中有人”或“此音轨包含语音文本”或“此音频曲目包含音乐'
标签: video audio semantic-analysis