通过双重分解的双语语义角色标签推理
本文重点介绍双语语义角色标记(SRL); 它的目标是在平行双语文本(bi-text)的两侧注释语义角色。 由于对丰富的双语信息进行了编码,因此双语SRL已应用于许多自然语言处理(NLP)任务,例如机器翻译(MT),跨语言信息检索(IR)等。 执行双语SRL的一种可行方法是使用单语SRL系统在双语的每一侧分别执行SRL。 但是,以这种方式很难在双文本的两侧获得一致的SRLL结果。 一些作品试图共同推断双语SRL,因为在双语的两侧都有许多互补的语言提示,并且它们报告的性能要优于单语系统。 但是,现有方法有两个限制。 首先,由于复杂的目标函数,现有方法经常需要较高的推理成本。 其次,现有方法完全采用了由单语SRL系统生成的候选,但是在单语系统的参数修剪或识别阶段却丢弃了许多候选。 在本文中,我们提出了两种克服这些限制的策略。 我们利用一种简单而有效的技术:双重分解来搜索双文本双方的一致结果。 另一方面,我们提出了一种称为双向投影(BDP)的方法来恢复在单语言SRL系统中丢弃的参数。 我们在标准并行基准上评估我们的方法:OntoNotes数据集。 实验结果表明,与最新的单语言系统相比,我们的方
暂无评论