agatha christie nlp 源码
关于阿加莎·克里斯蒂小说的NLP 执行摘要: 一些粉丝和专家认为,阿加莎·克里斯蒂(Agatha Christie)在她晚年的时候并未诊断出痴呆症。 2009年发表的一篇论文对阿加莎·克里斯蒂(Agatha Christie)的14部小说进行了研究,发现随着年龄的增长,重复短语类型的增加,不确定单词的使用增加以及独特单词类型的减少。 该项目的目标是首先使用她的70部小说而不是14部小说来复制论文的发现,并更深入地分析她的作品。 数据源: 阿加莎·克里斯蒂(Agatha Christie)的小说从互联网档案馆以ePUB格式下载。 发现: 我能够复制论文的发现。
文件列表
agatha-christie-nlp
(预估有个108文件)
Poirot's Early Cases - Agatha Christie.txt
508KB
An Autobiography - Agatha Christie.txt
1.26MB
Hercule Poirot_ The Complete Sh - Agatha Christie.txt
1.84MB
Death on the Nile_ Hercule Poir - Agatha Christie.txt
462KB
Miss Marple_ The Complete Short - Agatha Christie.txt
576KB
The Secret Adversary_ A Tommy & - Agatha Christie.txt
467KB
02-NLP-replicating-paper-findings.ipynb
312KB
short_stories_df.csv
314KB
all_clean.csv
24.79MB
books_df_cleaned.csv
28.37MB
暂无评论