TED平行语料库数据集
TED平行语料库是一个多语言平行语料库,包括多语言并行语料库和单语语料库。该语料库从TED会议中提取了109种世界语言的文本数据。多语言的平行语料库包括12种语言,涵盖了超过1.2亿个对齐句子,并且这些句子均经过自动预处理和对齐。如果你对相关语料库有兴趣,尤其是中英平行语料库,可以点击这里下载。如果你还需要更多不同类型的语料库,如英语语料库LOB语料库,可以访问这个链接了解详情。对于其他应用场景,还可以查看不同的语料库,如自然语言处理语料库或情感语料库,以满足不同研究和应用的需求。