颜色分类leetcode Cityscapes数据集上的PyTorch U-Net这个存储库包含我第一次尝试从.这最终比我预期的更具挑战性,因为python中的数据处理工具并不像我预期的那么简单。在PyTorch框架内,他们为Cityscapes数据集提供了一个“数据加载器”,但它并不真正适合任何分割任务。我建立了那里的初始代码,以允许将相同的随机变换应用于rgb图像和标签。此外,用于训练的类数量已经减少,可以通过更新dataset.py加载器中的映射数据类型轻松更改。网络输出[N, classes, W, H]大小的张量,然后需要将其转换为预测。为了找到给定像素的分类,类响应的argmax为每个计算并对应于类。在保存到磁盘之前,我将此classid转换回rgb颜色,以便与地面实况标签进行视觉比较。我发现网络预测在四个epoch后给出了不错的视觉结果。训练模型请查看script_train.py文件以获取有关可能参数的详细信息。您首先需要下载cityscapes数据集并提取它。如果您想进行逐像素分割,通常会使用