该文档涵盖ChatGPT的训练数据采集和清理策略。