这项工作的目的是在测试挖掘的第一阶段将拼写检查器作为一项额外的预处理过程进行行为分析。 分析了不同的模型,选择了最完整的模型,将预处理作为文本挖掘过程的初始部分。 西班牙语语言的算法已开发和改编,并且通过分析2363个单词进行了方法学测试。 创建了一种用于删除特殊字符和多余字符的功能强大的注释。 分析了每种算法的执行时间,以测试使用和不使用正交修订的文本挖掘预处理的效率。 使用拼写检查器的总时间比不使用拼写检查器的总时间短。 这项工作与现有相关研究之间的主要区别在于,首次在文本挖掘预处理过程中使用了拼写检查器。