灾害响应管道项目 表中的内容 项目动机 文件描述 操作说明 许可,作者,致谢 投影动机 由于人为错误或人与人之间共享信息时出现不可避免的延迟,对事故现场或犯罪现场的响应通常会无意间延迟,这在应急响应机构中普遍存在,以应对遇险呼叫。 因此,我创建了一个ML模型,该模型能够根据正确的响应机构对遇险消息进行分类。 文件描述 提供了具有ETL模型的木星笔记本。 从图8中提取了以csv文件形式的数据集,并将其合并为一个文件,然后加载到sql数据库中。 然后,使用填充文本处理步骤对这些数据进行转换: 清洁以删除不相关的项目,例如HTML 通过将所有文本转换为小写格式并删除标点进行规范化 将文本分为单词或标记的序列 删除常见的单词,也称为停用词 使用lemmatizaton将单词转换成其字典形式或词根 清理数据后,制作了四个管道结构,其中包含定义了一系列步骤的变压器和估算器对列表。 countvec