minbert assignment:CS11 747的极简BERT实施分配 源码
明伯特作业 姜正宝,周树彦和Ritam Dutt 这是开发BERT的最低版本的练习,该版本是卡耐基梅隆大学。 在此作业中,您将实现BERT模型的一些重要组件,以更好地理解其架构。 然后,您将使用BERT模型对sst数据集和cfimdb数据集执行句子分类。 作业详细信息 重要笔记 按照setup.sh正确设置环境并安装依赖项。 在中有代码结构的详细描述,其中包括需要实现哪些部分的描述。 只允许使用torch ,不允许使用其他任何外部库(例如, transformers )。 我们将使用以下命令来运行您的代码,因此请确保使用这些命令(无论用ANDrew ID替换ANDREWID)都能获得最好的结果: mkdir -p ANDREWID python3 classifier.py --option [pretrain/finetune] --epochs NUM_EPOCHS --l
文件列表
minbert-assignment-main.zip
(预估有个21文件)
minbert-assignment-main
tokenizer.py
102KB
utils.py
12KB
sanity_check.py
612B
data
cfimdb-train.txt
1.55MB
sst-dev.txt
119KB
sst-train.txt
915KB
cfimdb-test.txt
455KB
cfimdb-dev.txt
234KB
暂无评论