doc-clf-aws-lambda 此存储库包含完整的代码和玩具数据,以训练文档分类器和模板,这些文档分类器和模板是使用AWS lambda函数创建无服务器Web服务所需的。 随机森林用作分类器。 原始模型的测试数据准确度为0.8169,培训的准确度为0.8188。 但是它不能在AWS上使用,因为该模型很大,并且在AWS上执行预测时会超时。 ligher版本正以0.7875的精度在云上使用。 混淆矩阵可以在jupyter笔记本脚本中找到。 doc_clf_tryout1.ipynb 使用Jupyter Notebook进行模型训练脚本 handler.py 具有lambda函数的模型管道。 serverless.yml AWS无服务器部署的配置文件 随机播放完整集hashed.csv.zip 原始数据集 doc_clf_best_estimator.pkl AWS上使用的模