针对煤炭企业网络营销,介绍了数据挖掘,Web挖掘和短文本分类的理论,分析了短文本分类的几种算法。尝试利用HTML标记权重来改善朴素贝叶斯算法的条件独立假设的不足,并利用标记中的有用信息结合短文本分类算法进行短文本分类。最后,针对改进的分类器的在精确率上不太理想的特点,对本课题下一步要研究的内容进行了总结,并提出了自己的一些看法。