DialogRPT:对话框排名预训练的变形金刚 预测人类的反馈(赞) :thumbs_up: 或回覆 :speech_balloon: )的对话回应。 它是由提出的一组对话响应排序模型,该模型接受了100多百万个人反馈数据的训练,并被接受出现在。 通过对生成的响应候选进行重新排序,可以使用它来改进现有的对话框生成模型(例如 )。 此仓库提供了PyTorch实施和预训练的模型。 快速链接: 和 演示: 或 我们考虑了以下任务,并提供了相应的预训练模型。 (点击 :floppy_disk: 下载此仓库的原始pytorch检查点,或单击 :hugging_face: 使用HuggingFace模型卡) 任务 描述 预训练模型 人的反馈 updown 响应获得最多投票的可能性有多大? / width 回复获得最直接回复的可能性有多大? / depth 响应获得最长追踪线程的可能性有多大? / 类人(人与假) human_vs_rand 响应与给定上下文的