UniEval自然语言生成的多维评估工具 研究场景: 自然语言生成(NLG)中的多维评估在人工评估中占主导地位,通过评估文本的连贯性和流畅性等多个可解释维度。前人方法:然而,在NLG中仍然主要使用基于相似性的指标进行自动评估,缺乏一个可靠的框架来对高级模型进行更全面的评估。本文方法:本文提出了一种面向NLG的统一多维评估工具——UniEva