GPT-4的最大亮点是支持多模态输入,可以输入图片和文本,允许用户指定任何视觉或语言任务。通过结合多模态的发展,大模型可以使用现实中各领域的不同模态输入输出数据进行微调,优化出功能多样的多模态模型。目前主要用于搜索及聊天机器人,但未来在Office类工具、智能家居、工业视觉、行业化机器人等方面也有广泛应用前景。