我们提出一个基于内容的多媒体检索的方法 对象与视觉、听觉和文本属性。在我们的方法,训练 对象的例子属于一个特定的语义类相关联 与他们的低级视觉描述符(例如mpeg 7)和文本 功能,如频率的重要关键词。一个模糊映射的 一个语义类训练集的一个类类似的对象 测试集是由使用自组织映射(索姆)训练从 自动提取底层描述符。我们已经做了几 实验用不同的文本特性来评估潜在的 我们的方法在弥合差距从视觉特征语义 通过使用文本演示概念。我们的初步结果显示 承诺增加检索性能。