机智:WIT(基于Wikipedia的图像文本)数据集是一个大型的多模式多语言数据集包含超过1100万种独特的图像以及超过100种语言的37M +种图像文本对

driver_67728 4 0 ZIP 2021-04-09 19:04:21

WIT:基于维基百科的图像文本数据集基于维基百科的图像文本(WIT)数据集是一个大型的多模式多语言数据集。 WIT由3,760万个实体丰富的图像文本示例的精选集组成,这些示例文本包含108种Wikipedia语言中的1,150万个唯一图像。它的大小使WIT可以用作多模式机器学习模型的预训练数据集。关键优势 WIT的一些独特优势: 按图像文本示例的数量最大的多模式数据集(撰写本文时)。大规模的多语言(同类中的第一种),涵盖了100多种语言。各种概念和现实世界实体的集合。提出具有挑战性的真实世界的测试仪。您可以从了解有关WIT数据集的更多信息。 WIT示例维基百科页面例如,让我们的Wikipedia页面。 Wikipedia页面,其中包含我们可以提取的内容的注释在此页面上,我们重点介绍了可以提取的各种关键数据-图像,它们各自的文本片段以及一些上下文元数据。通过

文件列表

wit-main.zip (预估有个4文件)

wit-main

images

wit_half_dome_wiki.png 493KB

tmp.txt 25B

wit_take2_half_dome_with_annotations.png 860KB

README.md 4KB

用户评论

暂无评论

10种常见猫科动物的图像分类数据集

本数据集包含10种常见猫科动物的图像，共2339个训练文件，50个测试文件和50个验证文件，均为224*224的JPG格式。其中包括美洲狮、云豹、猞猁、狮子、豹子、虎、金钱豹、野猫、犬猫和猫。这个数据

24 2023-04-15
MRA图像分割一种改进的水平集方法

体积数据的无监督分割仍然是一项艰巨的任务。最近,水平集方法受到了广泛的关注,该方法将全局平滑度与拓扑更改的灵活性相结合,并提供了优于常规统计分类的显着优势。但是,由于许多迭代,所以级别集方法的计算

22 2021-02-25
一种新的文本图像二值化方法

改进的二值化，希望对大家有用，放在上面大家参考！

29 2019-02-21
论文研究一种基于水平集的图像快速多区域分割方法.pdf

二维经验模态分解中边界效应抑制是一个关键问题，现有方法主要讨论一维信号端点效应抑制，基本思想是信号延拓，不适合对二维信号进行边界效应抑制。提出一种二维图像边界效应抑制方法，该方法根据对称性、局部性原理

22 2020-07-21
论文一种检测多语言文本相似重复记录的综合方法

一种检测多语言文本相似重复记录的综合方法

19 2018-12-22
一种基于数据融合的医学图像分割方法.pdf

一种基于数据融合的医学图像分割方法.pdf关于一种基于数据融合的医学图像分割方法的论文

12 2019-09-17
一种基于梯度差的文档图像文本行检测算法

在分析文本行特点的基础上,提出了一种利用水平梯度差进行文档图像的文本行检测算法。该算法首先对输入的文档图像进行水平梯度差计算,然后在局部窗口中求解最大梯度差并进行文本行区域的合并,通过非文本区域过滤来

6 2020-12-23
Python一个大规模的头部检测数据集包括标有111251个头部的4405个图像

一个大规模的头部检测数据集,包括标有111251个头部的4405个图像

5 2020-11-08
一种用用C语言实现的图像处理的方法

文档包含一些图像处理的方法，比较实用，是PDF格式的，希望有用。

17 2019-03-04
一种基于模糊集和小波变换的图像融合方法

提出了一种基于小波变换和模糊集的图像融合算法.其基本思想是:首先对图像进行小波变换,获得图像的低频和高频分量;随后在融合过程中,对低频和高频分量采取不同的融合策略,即对低频分量采用平均能量法进行融合,

17 2019-09-18

机智:WIT(基于Wikipedia的图像文本)数据集是一个大型的多模式多语言数据集包含超过1100万种独特的图像以及超过100种语言的37M +种图像 文本对

文件列表

用户评论

推荐下载

机智:WIT(基于Wikipedia的图像文本)数据集是一个大型的多模式多语言数据集包含超过1100万种独特的图像以及超过100种语言的37M +种图像文本对