医学图像分析中深度学习泛化的复杂性评估方法 此存储库中的代码基于我们的经验研究,该研究调查了针对乳房超声图像的监督深度学习分类器的复杂性度量与泛化能力之间的相关性。 该研究进行了。 用于医学图像分析的深度学习模型的性能通常会因使用不同设备收集的图像而下降,这些设备用于数据采集,设备设置或患者人群。 更好地理解新图像的泛化能力对于临床医生在深度学习中的可信度至关重要。 尽管近来已经进行了大量研究工作以建立泛化界限和复杂性度量,但是,预测的和实际的泛化性能之间通常仍然存在显着差异。 此外,相关的大型实证研究(例如 , )主要基于通用图像数据集的验证。 在我们的实证研究中,我们使用两种类型的预测任务来评估25种复杂性度量(从 )与一个深度学习网络系列在乳房超声图像上的泛化行为之间的相关性:(i)分类,以及(ii)联合分类和细分。 在受控的实验设置中,我们改变网络的深度以分析泛化性能。 结