为了从互联网环境下的用户评论中分析企业产品的缺陷,利用半监督分类中基于分歧的Co-forest算法对用户关于产品的评论进行文本分类,对Co-forest算法识别出的缺陷评论再基于主题模型BTM算法进行缺陷主题聚类,得到缺陷主题、主题描述详情及占比。以某品牌的一款畅销除湿机为例,对京东网站的评论进行相关研究。研究结果表明:Co-forest算法在基于在线评论的缺陷识别分类上相对于以往研究所采用有监督分类以及半监督分类Tri-training方法具有更高的性能。