OpenAI发布了最新版本的多模态大模型GPT-4及其API,而国内百度也发布了生成式大模型“文心一言”并开放邀请测试。本文对这两个国内外大模型进行了对比测评,在常识和创作、归纳和推理、数学和代码、应用等方面进行了评估。同时,还分析了它们的应用场景及优势和劣势。其中,GPT-3.5在数学能力上表现更好,但在情感推理等领域还需提升;文心一言在图像生成和归纳总结任务方面表现优异,但分词功能尚待提升。而GPT-4目前尚未开放图像生成外部测试。通过本文,希望读者能全面了解这三个大模型的性能差异和应用场景。