fastHan是一款高效的中文自然语言处理工具,基于fastNLP与PyTorch实现,使用方式类似spacy,方便快捷。其核心采用基于BERT的联合模型,经过在13个语料库上的训练,能够有效完成中文分词、词性标注、依存分析和命名实体识别等四大任务。fastHan提供了base和large两个版本,分别使用了BERT的前四层和前八层。即使是base版本的总参数量为150MB,也能展现出优异的任务表现;而large版本则接近或超越了当前最先进的模型。