我在本科毕业设计中致力于打造一款基于机器学习的新闻标题系统,并将相关源码分享给大家,详细介绍项目的设计与实现过程。该系统采用bert_base中文预训练模型,通过对NLPCC2017 Task2新闻标题分类数据集进行句向量训练,将训练好的模型以pkl格式存放在百度网盘中,供有兴趣的同学下载参考。项目的环境配置包括Python版本为3.8.13,操作系统为Windows,数据库选用MySQL,Web框架采用Flask,模型训练则基于sklearn。为了更方便地搭建环境,建议使用Anaconda创建虚拟环境,执行'conda create -n Graduation python=3.8'命令,然后通过'pip install -r requirements.txt -i https://pypi.tuna.tsinghua.edu.cn/simple'安装必要的第三方库。将数据导入数据库的操作为执行'mysql -u root -p --local-infile=1 < D:\Bachelor_Graduation.sql'。模型训练的具体步骤包括执行preprocess.ipynb文件,系统会自动生成model文件夹,存放着已训练好的模型文件。系统启动的命令为'python main.py',在浏览器端输入...
暂无评论