来自搜狐网的十类新闻数据,建议用pandas的read_pickle读入。有少量空行数据。使用方法见博客