暂无评论
平行语料库,用于机器翻译等的预处理语料。 汉英双语语料和德英双语语料,可以用来训练NMT模型,谨供学术实验用
中英平行语料(白皮书,可以用于机器翻译,主题提取)
NiuTrans的开源中英平行语料库,可以用来训练机器翻译。
语料来源为WMT18,本资源包含中英文的平行语料50000句,以及简单预处理后的文件。中文预处理:去除标点、数字,分词;英文预处理:去除标点、数字,大小写转换。可以用来做简单的神经机器翻译练习使用。
UNparallelcorpus.15,886,041linescasia2015:1,050,000linescasict2015:2,036,833linesdatum2015:1,000,003
机器翻译的语料库.docx
英文-中文的一个文件,大约有两万个句子对,每一个句子对是(英文,中文),文件不大,主要用来做中英的机器翻译。
平行语料库,用于机器翻译等大数据处理,有需要的可以下来用,可以直接用,不用全角半角变换
中英文平行语料库,用于机器翻译,问答系统等模型的预处理语料
机器翻译原理
暂无评论