NextWordUp-Capstone 由WritPen撰写 这个项目的作者以前没有做过单词预测。 我通过学习有关如何构造文本,使用ngram计算和探索数据的科学来开始这个项目。 探索性数据分析位于Milestone 1文件中。 然后,作者思考如何最好地构建算法,以及单词之间的关系的理论。 我阅读了有关文本挖掘和预测的资源,包括与文本挖掘和文本预测有关的R包,以及有关构建机器学习模型的研究成果,这些模型映射到人类在构建文本时使用的细微差别。 包括的资源:R包Text2vec- ://cran.r-project.org/web/packages/text2vec/vignettes/