中文分词词典
自然语言处理中基于java的自动分词拼音词库
自己搜集来的词典,有重复的一些,自己甄别,里面包了清华大学词典,台湾大学词典,知网词典等,褒义词,贬义词,情感词一类的,反正挺多的
NULL博文链接:https://goofyan.iteye.com/blog/2223945
一个30万字的中文分词词典,从网站码农场中提供的词典分割的一部分,需要说明的是词典不是最新的,仅供参考使用。
完整的同义词词集,可用于分词,一份不可多得的同义词词典。
概要 这是指定的修改后的merkle patricia树的实现: 修改后的Merkle Patricia树(trie)提供了一种持久性数据结构,可以在任意长度的二进制数据(字节数组)之间进行映射。 它
在中文自动分词及词性标注系统中,电子词典是系统的重要组成部分,也是影响系统性能的重要因素之一。介绍了电子词典应该具备的查询功能及常用的组织结构,给出了一种结构为系统词典 用户词典的可扩展式电子词典机制
A Chinese word segmentation algorithm based on N-gram model and machine learning
国内的有道词典和金山词典由于使用方便、宣传到位得到了许多同学的喜爱。在开源软件的领域,也有一款非常好用的词典GoldenDict,它的强项在于可以直接使用众多词典厂商的词库。那些正规的词典厂商通常购买