皮尔托奇的Densecap 简化pytorch版本 发出或直接通过与我联系 什么是密集帽? 从图像中检测区域,并用简短的句子描述每个区域。 参见或 那这个实现呢? 事情是最新的:Python 3.7和pytorch 1.4.0 我们的模型代码直接从继承了GeneralizedRCNN,并试图使其易于理解和使用(希望如此)。 因此,区域检测器部分与原始纸张不同。 应该可以在具有12GB内存的单个GTX 1080Ti GPU上进行训练。 要求 的Python 3.7 pytorch 1.4.0 火炬视觉0.5.0 麻木 皮尔 h5py tqdm 张量板 DataLoader的预取版本: : 顶点: : (以加快培训速度) nlgeval *: : 注意:我们使用nlgeval来计算Meteor,您可以修改validate.py以使用其他方法,例如coco-