音频-视觉 音频和计算机视觉相关论文在python实现与评论。 我们的大多数代码都使用库。 [1] Dcase Challenge 2016的深度神经网络基线[ ] [] [2]基于CQT的卷积神经网络用于音频场景分类和家庭音频标记[ ] [] [3]用于声音场景分类的卷积神经网络方法[] [] [4]用于和声事件检测的卷积递归神经网络[] [] [5] FrameCNN:用于框架声音事件检测和分类的弱监督学习框架[ ] [] [6]基于深度卷积递归模型的弱监督音频标记的注意和定位[] [] [7]探索图像问题解答的模型和数据[] [] [8]用于图像问题解答的堆叠式注意力