dunder mifflin:电视节目The Office(美国)的脚本的清洁和分析 源码
清理和分析Office(US)脚本的模块 如何使用 在根文件夹中,运行 python -m run 将加载,分析脚本并将关键统计信息保存到data / processed /文件夹中。 过程 首先加载数据,然后将情节名称从第二个数据集( process_script.py )添加到原始表中 然后,将每一行分解为令牌,并对单词进行计数( breakdown_line.py ) 处理每一行以提取其情感得分和提及的字符( analyze_line.py ) 经处理的和anaylzed线被保存processed_script.csv 最后,字数和行数汇总到多个文件中,并且一个主表保存在all_c
文件列表
dunder-mifflin-master.zip
(预估有个25文件)
dunder-mifflin-master
src
utils.py
1KB
explore_script
viz_overtime.py
1KB
__init__py
0B
dundies.py
2KB
process_script
aggregate_script.py
5KB
process_lines.py
2KB
暂无评论