汉字单字字频总表 /*CombinedcharacterfrequencylistofClassicalandModernChinese*//*汉字单字字频总表*//*拼音取自于http://www.mandarintools.com/cedict.html,http://www.chinese-forums.com
人民日报微博数据 共74638条数据,爬取时间的为2018年3月18日,数据包括爬取时间,爬取链接,微博url,用户id,用户昵称,用户头像,关注数,粉丝数,发布时间,微博内容,微博内容txt,发自,转发数,评论数,点赞数,是否长微博,微博配图,视频地址,视频封面,是否转发,原微博,转发,热门评论,评论
爬取的豆瓣图书数据 2300+数据,包括:ISBN全球唯一图书编号;Title书名;Author作者;Author_intro作者简介;Tag标签;NumRaters评分人数;Average评分;Id豆瓣内该书Id;Binding精装/简装;Pages页数;Publisher出版商;Origin_title图书原名Ur
故宫博物院微博数据 共2556条数据,爬取时间的为2018年3月18日,数据包括爬取时间,爬取链接,微博url,用户id,用户昵称,用户头像,关注数,粉丝数,发布时间,微博内容,微博内容txt,发自,转发数,评论数,点赞数,是否长微博,微博配图,视频地址,视频封面,是否转发,原微博,转发,热门评论,评论
央视新闻微博数据 共85959条数据,爬取时间的为2018年3月18日,数据包括爬取时间,爬取链接,微博url,用户id,用户昵称,用户头像,关注数,粉丝数,发布时间,微博内容,微博内容txt,发自,转发数,评论数,点赞数,是否长微博,微博配图,视频地址,视频封面,是否转发,原微博,转发,热门评论,评论
网易新闻微博数据 共1761条数据,爬取时间的为2018年3月18日,数据包括爬取时间,爬取链接,微博url,用户id,用户昵称,用户头像,关注数,粉丝数,发布时间,微博内容,微博内容txt,发自,转发数,评论数,点赞数,是否长微博,微博配图,视频地址,视频封面,是否转发,原微博,转发,热门评论,评论