SAM作为机器视觉领域的ChatGPT Meta Al发布通用大模型,其最强大之处在于其零样本泛化能力。SAM已经了解了物体的一般概念,所以可以在不需要额外训练的情况下对不熟悉的物体和图像进行零样本泛化。另外,SAM还有其他优点,比如能与其他系统灵活集成,以及进行可拓展式输出等。SAM的训练模型在CV领域是数据引擎,其高级功能是其对大量图像和掩码进行训练的结果。此外,SAM的模型设计非常灵活。SAM已经实现开源,模型训练需要256个A100 GPU约3-5天,而图像编码器大约需要0.15秒。