【发布时间】:2013-10-14 09:29:01
【问题描述】:
我从未尝试过,只是好奇是否有可能检测到音频流中的广告?我的意思是除了机器学习什么的。广告期间有关字节流的一些细节。也许是一种不同的响亮值?
【问题讨论】:
标签: audio streaming video-streaming audio-streaming audio-recording
我从未尝试过,只是好奇是否有可能检测到音频流中的广告?我的意思是除了机器学习什么的。广告期间有关字节流的一些细节。也许是一种不同的响亮值?
【问题讨论】:
标签: audio streaming video-streaming audio-streaming audio-recording
从纯音频的角度来看,这是不可能的。广告和其他音频内容之间没有任何区别。当然,您可能会争辩说,播放音乐的电台与播放广告时的频谱特征不同,但同时播放音乐的广告呢?您如何区分播音员和阅读广告的人?如果广告嵌入在正常内容中怎么办?
现在,一些电台确实提供元数据,其中偶尔包含广告信息。如果您查看特定内容项的长度,您的广告通常会不到一分钟或 30 秒。您如何获取和处理这些元数据取决于您使用的流类型。
【讨论】:
有一些新兴技术可以做到这一点,它们倾向于利用已知广告的数据库来解决布拉德在他的回答中正确强调的理论问题。
然而,下面的其中一个参考文献使用了一种技术,该技术基于在广告开始时检测音频中的细微差异作为初始检测触发器。
一些技术还使用音频和视频流来辅助检测 - 例如,下面的 Google 论文首先使用音频匹配,然后使用视频进行验证/验证。
对于任何对此领域感兴趣的人来说,一些可能值得一看的资源(我意识到这是一个老问题,但它仍然是热门话题):
【讨论】: