ChatGPT 使用了大量文本数据进行训练,涵盖广泛领域,包括新闻文章、书籍、对话、代码等。这些数据通过爬取网络、购买许可证和与数据提供商合作等方式获取。