MNIST手写与机器学习 方法 1)数据处理: 在这里,我们检查NaN值是否包含,并检查数据集是否平衡2)确定最合适的算法(algorithm_selection.ipynb): 在这里,使用KNN,SVM,随机森林,逻辑回归算法为该数据集选择最合适的算法。 选择KNN和SVM作为要与训练数据和测试数据进行测试的最佳算法,从中比较训练时间并选择KNN作为训练。 局限性:这需要大量的计算能力,因此我们使用总体中的数据集样本来选择最佳算法3)使用选定的算法(model_train.ipynb)开发模型: 首先确定合适的K值:使用k = 1进行训练,并获得约97%的准确度