本发明提供一种模型训练方法及装置可以从数据记录日志中提取出第一数量的匹配行为记录数据其中各匹配行为记录数据均包括相对应的待匹配数据和标注有样本类别标识的至少一条反馈数据样本类别标识包括正样本标识和负样本标识按照同一匹配行为记录数据中正样本匹配度高于负样本匹配度的训练目标利用各匹配行为记录数据对数据匹配模型进行训练其中正样本匹配度为标注有正样本标识的反馈数据与待匹配数据的匹配度负样本匹配度为标注有负样本标识的反馈数据与待匹配数据的匹配度.本发明可以优化对数据匹配模型的训练效果使得数据匹配模型可以匹配到以及向用户展示更能满足用户实际需求或更感兴趣的数据.