OpenAI的模型现在可成功解决小学数学应用题,即使这些问题对人类来说很简单,一些模型也会有困难。但是,展现模型处理问题能力的重要性,OpenAI研究人员创建了一个训练验证器(verifier)来检查模型完成的正确性。对于像“安东尼有50支铅笔”这样的问题,模型需要准确的多步推理能力。虽然类似GPT-3的模型可以从生成的解决方案中选择最优并排名,但这个过程经常产生严重的逻辑错误。要通过训练来提高模型在这些领域的性能,需要使模型具有判断正确性的能力,并小心处理后续的解决方案。