SAM可以使用各种输入提示包括点击,框选和文字,指定要在图像中分割的内容,并且可以灵活集成其他系统。SAM初步验证了多模态技术路径及其泛化能力,相当于计算机视觉领域的GPT-3。