基于小波包最优基的音乐指纹提取算法 数字音乐指纹提取的主要目的是建立一种有效机制,用于比较2 个音乐文件的听觉质量。提出一种基于小波包最优基分解的音乐指纹提取算法,利用与音频内容密切相关的小波包系数,将其作为特征进行指纹提取。实验结果表明,该算法对MP3, WMA 和RM 压缩、噪声、Stirmark for audio 工具中常见的
一种快速鲁棒的广告音频指纹提取方法 利用音频特征检测电视广告具有处理速度快、准确率高等优点,为此提出一种快速鲁棒的广告音频指纹提取方法。该方法将优化后的频域分为33 个频带,分别计算当前帧相邻2 个子带频域幅值的差异值与前一帧对应的相邻2 个子带频域幅值的差异值,并将2 帧的差异值之和相应设为0 或1,每帧提取32 个0/1 值作为指
基于LSH的中文文本快速检索 首先介绍了LSH算法的基本原理和方法,然后使用多重探测的方法对二进制向量的LSH算法做了进一步改进。最后实现了这两种LSH算法,并通过详细的实验验证表明:在改进后的算法中,通过增加偏移量可以提高检索的召回率,而在不提高时间复杂度的情况下则可降低空间复杂度。
基于音频语谱图像识别的广告检索 随着中国广播电视事业的快速发展,对广播电视进行广告监测的重要性越来越突出。该文提出了一种基于音频语谱图像识别的广告检索方法,该方法把每个广告片段的音频转换成语谱图像,并通过boosting训练算法,从中提取可区分的、适合索引的特征以训练分类器。检索时,通过特征对齐,采用基于期望最大化(expecta