# 语言模型微调数据集

使用GPTIndex微调GPT3轻松自定义语言模型数据

GPT-3是当前最先进的语言模型之一,已经在大量文本数据上进行了训练,具有极强的生成文本能力。但有时候,我们希望用自己的数据集来
4 doc 2023-06-22

模型微调指南

模型微调是指在预训练模型的基础上,使用特定任务的数据集进行进一步训练,以提高模型在该任务上的性能。 微调步骤: 选择预训练模型
2 ipynb 2024-07-05

语言模型数据.md

语言模型 一段自然语言文本可以看作是一个离散时间序列,给定一个长度为 T 的词的序列 w1,w2,...,wT ,语言模型的目标
13 MD 2020-08-20

使用huggingface微调SST数据进行自然语言处理二分类模型训练

使用SST2数据集对自然语言处理预训练模型进行微调,可以用于文本分类、情感分析等下游任务。在具体操作训练时,可以参考huggin
7 zip 2023-03-08

百万级领域数据微调模型雅意

百万级人工标注高质量领域数据微调训练,覆盖媒体、舆情、安全、金融、治理等五大领域数百种指令任务。优化中文基础、领域分析、插件能力
1 zip 2024-04-27

微调作品源码

主自述文件
6 ZIP 2021-02-23

最新弱监督预训练语言模型微调报告

迁移学习从根本上改变了自然语言处理(NLP)的处理范式。许多最先进的模型首先在大型文本语料库上进行预先训练,然后在下游任务上进行
28 PDF 2020-12-28

ChatGLM微调指令数据的应用与价值

ChatGLM微调指令数据集对于大模型微调训练具有重要意义。其数据格式采用了包含指令、输入和输出的结构,这种设计有助于模型在学习
70 zip 2023-11-27

English Language Model Word Prediction Competition DatasetKaggle Challenge

在自然语言处理(NLP)领域,语言模型是至关重要的工具,它们能够估计给定文本序列的概率,并在各种任务中发挥作用,如机器翻译、语音
9 zip 2024-12-16

LoAR微调AI模型代码

LOAR微调AI模型代码
0 rar 2025-01-05