疫情相关NLP微博数据集
数据集为依据与“新冠肺炎”相关的230个主题关键词进行随机数据采集的2020年1月1日—2020年2月20日期间共计100万条微博数据,公开数据集: 其中每列的含义: - id: 微博序号,主键 - weibo_id: 微博id - daytime: 微博发布时间, 从0000-2359 - name:发布人账号 - content:微博中文内容 - day:日期 - month:月份 - sentiments:使用snowNLP分析得出的情感数值,范围为-0.5 ~ 0.5,大于0为正面情感,小于0为负面情感; - keyword0-4:使用jieba分词提取的主题关键词,取前四位; 使用
用户评论
推荐下载
-
人民日报微博数据
共74638条数据,爬取时间的为2018年3月18日,数据包括爬取时间,爬取链接,微博url,用户id,用户昵称,用户头像,关注数,粉丝数,发布时间,微博内容,微博内容txt,发自,转发数,评论数,点
34 2019-09-02 -
基于新浪微博的数据获取
便于抓取,易于上手,比如说HashMap的使用、线程的同步问题、静态变量的使用等等。
37 2019-01-22 -
javasdk新浪微博数据采集代码
新浪微博最新数据采集,数据采集,利用进程控制程序的采集频率,将采集的数据写进指定的文件夹中,采集的数据还进行了去重操作
45 2019-01-09 -
NLP相关最新教程合集
其中涉及开发工具、Python语言、线性代数、概率论、统计学、语言学等工程上常用的知识介绍,通过几个综合性的例子完成自然语言处理的学习和深入
14 2020-09-24 -
疫情可视化大屏项目数据集
面向全国的疫情可视化大屏项目数据集,包含国内外疫情数据。
5 2024-04-26 -
NLP训练数据集学习001文本分类与情感分析数据集下载
NLP训练数据集学习001:文本分类与情感分析数据集是用于自然语言处理任务中的一个重要资源。该数据集包含了大量经过标注的文本数据,可用于训练机器学习模型进行文本分类和情感分析。它涵盖了各种领域的文本,
6 2023-07-18 -
商务数据分析与应用1单篇微博分析微博博文内容概况.ppt
商务数据分析与应用 江苏经贸职业技术学院 2016微博用户发展报告 微博博文内容概况 微博博文内容概况 高粘性用户数量占比较上年有所增加 高粘性用户数量占比较上年有所增加从整体用户登录情况来看全年月均
14 2020-12-23 -
微博博主的特征与行为大数据挖掘
随着社交网络在互联网、移动互联网上的快速发展,社交网络用户的大量个人信息在互联网上公开,原本碎片化的信息在大数据环境下被整合,并由此形成了社交网络的大数据环境。
30 2019-05-13 -
集博台湾集博公司及服务简介.ppt
集博 台湾集博公司及服务简介ppt,集博 台湾集博公司及服务简介
10 2020-09-20 -
微博源码
微博源码.
17 2019-08-12
暂无评论