对爬取的搜狐文档数据进行自动分类,主要有“体育,健康,房地产,娱乐,女人,文化,新闻”等文章类别,已经标记好为训练数据