氟dex 使用自然语言处理(NLP)分析泰诺奇蒂特兰沦陷前佛罗伦萨法典(约1560年代)的两种不同的文字叙述。 数据位于.txt文件中,并通过Stanza预训练的英语语言模型进行标记和注释。 然后,将Stanza文档转换为python对象(词典列表),类“ Section”从该对象开始,接受每个转换后的Stanza文档并创建多索引的Pandas数据框。 EDA任务:句子长度,UPOS使用率(%),单词选择,情绪分析(%)