Python中的短文本挖掘 介绍 此程序包shorttext是一个Python程序包,可促进对短文本分类进行有监督和无监督的学习。 由于单词的稀疏性以及短文本本身携带的信息不足,在将文本和文档放入任何分类算法之前,需要对文本和文档进行中间表示。 在此程序包中,它促进了这些表示形式的各种类型,包括主题建模和词嵌入算法。 从1.2.4版开始,它可以在Python 3.8上运行。 从1.2.3版开始,不再支持Python 3.5。 从1.1.7版开始,不再支持Python 2.7。 从1.0.8版开始,它就可以在Python 3.7上运行,并且'TensorFlow'是keras的后端。 从1.0