Rethinking the Inception Architecture for Computer Vision
Rethinking the Inception Architecture for Computer Vision 重新思考计算机视觉的初始架构 Christian Szegedy, Vincent Vanhoucke, Sergey Ioffe, Jonathon Shlens, Zbigniew Wojna (2015年12月2日提交(v1),最近于2015 年12月11日修订(本版本v3)) 卷积网络是大多数最先进的计算机视觉解决方案的核心,用于各种各样的任务。自2014年以来,非常深入的卷积网络开始成为主流,在各种基准测试中取得了实质性的进展。虽然增加的模型大小和计算成本趋向于转化为大多数任务的即时质量增益(只要为培训提供足够的标签数据),计算效率和低参数计数仍然是各种用例的移动视觉和大数据情景。在这里,我们探索如何通过适当的因式分解和积极的正则化来以网络的方式扩展网络,从而尽可能高效地利用增加的计算。我们对ILSVRC 2012分类挑战验证集的方法进行了基准测试,证明了相对于现有技术的实质性收益:使用计算成本为50亿乘法的网络进行单帧评估的21.2%的前1和5.6%增加每个推断和使用少于2500万个参数。通过4个模型和多作物评估的综合,我们报 告验证集上3.5%的前5个错误(测试集上为3.6%的错误)和验证集上的17.3%的top-1错误。
用户评论