2022年11月,OpenAI推出了聊天型人工智能模型ChatGPT,引起了广泛关注。随后,BuzzFeed在2023年1月宣布与OpenAI合作,共同推动创意生成技术在市场上的应用。谷歌、微软、百度、阿里巴巴、字节跳动、腾讯、华为和科大讯飞等众多国内外互联网企业也纷纷宣布拥有GPT相关技术储备。其中,科大讯飞于4月20日宣布将于5月6日发布讯飞星火大模型。然而,在4月24日,科大讯飞却意外地启动了公测,并允许用户通过填写问卷调查获取测试资格。一些网友称其为“反向跳票”,但也能看出科大讯飞对讯飞星火大模型的自信。在发布会上,科大讯飞董事长刘庆峰表示,“认知大模型还在快速成长和迭代过程中,单点例子无法全面评价系统的优劣。”本文将基于科大讯飞的科学评测体系,探索讯飞星火大模型的潜力。我们将先从一些小问题入手,评估“星火”在各项功能上的表现能力。其中,星火认知大模型的能力涵盖七个维度,包括文本生成、逻辑推理、语言理解、数学能力、代码能力、知识问答和多模态能力。