12大类150个图像处理和深度学习开源数据集

youcans_ 2024-06-11 17:31:08 阅读 100

12大类 150个图像处理和深度学习开源数据集

本文整理了150 个深度学习和图像处理领域的开源数据集，包括：目标检测、人脸识别、文本识别、图像分类、缺陷检测、医学影像、图像分割、图像去雾、关键点检测、动作识别、姿态估计、自动驾驶和 RGBT 等12个方向。

1. 目标检测（detection）

在这里插入图片描述

1. T-LESS数据集

类型：目标检测

数量：39000

类型：目标检测

数量：1198

数据集下载地址：https://github.com/desenzhou/ShanghaiTechDataset

说明：

上海科技数据集是一个大规模的人群统计数据集。它由1198张带注释的群组图像组成。

数据集分为两部分，A部分包含482张图像，B部分包含716张图像。A部分分为训练和测试子集，分别由300和182张图像组成。B部分分为400和316张图像组成的序列和测试子集。群组图像中的每个人都有一个靠近头部中心的点进行注释。总的来说，该数据集由33065名带注释的人组成。A部分的图像是从互联网上收集的，而B部分的图像是在上海繁忙的街道上收集的。

12. DOTA航拍图像数据集

类型：目标检测

数量：1793658

数据集下载地址：https://captain-whu.github.io/DOTA/dataset.html

说明：

DOTA是用于航空图像中目标检测的大型数据集。它可以用于开发和评估航空图像中的目标探测器。这些图像是从不同的传感器和平台收集的。每个图像的大小在800×800到20000×20000像素之间，包含显示各种比例、方向和形状的对象。DOTA图像中的实例由航空图像解释专家通过任意（8 d.o.f.）四边形进行注释。

DOTA-v1.0包含15个常见类别、2806个图像和188282个实例。DOTA-v1.0中训练集、验证集和测试集的比例分别为1/2、1/6和1/3。

DOTA-v2.0收集更多谷歌地球、GF-2卫星和航空图像。DOTA-v2.0中有18个常见类别、11268个图像和1793658个实例。

13. 生活垃圾数据集

类型：目标检测

数量：9000

数据集下载地址：https://www.kaggle.com/datasets/dataclusterlabs/domestic-trash-garbage-dataset

说明：

该数据集是一组极具挑战性的原始垃圾/垃圾图像，共有9000多张，这些图像来自2000多个城市和农村地区。

图像是在各种照明条件、天气、室内和室外条件下拍摄的。该数据集可用于制作垃圾/垃圾检测模型、环保替代建议、碳足迹生成等。

14. 火焰和烟雾图像数据集

类型：目标检测

数量：7000

数据集下载地址：https://www.kaggle.com/datasets/dataclusterlabs/fire-and-smoke-dataset

说明：

该数据集由早期火灾和烟雾的图像数据集组成。数据集由在真实场景中使用手机拍摄的早期火灾和烟雾图像组成。大约有7000张图像数据。图像是在各种照明条件（室内和室外场景）、天气等条件下拍摄的。该数据集非常适合早期火灾和烟雾探测。

数据集可用于火灾和烟雾识别、检测、早期火灾和烟雾、异常检测等。数据集还包括典型的家庭场景，如垃圾焚烧、纸塑焚烧、田间作物焚烧、家庭烹饪等。

15. 全球小麦检测数据集

类型：目标检测

数量：4700

数据集下载地址：https://www.kaggle.com/c/global-wheat-detection/data

说明：

检测小麦穗是一项重要任务，可以估计相关性状，包括穗种群密度和穗特征，如卫生状况、大小、成熟阶段和芒的存在。

本数据集包含 4,700 张高分辨率 RGB 图像和 190,000 个标记的小麦头，这些小麦头采集自世界各地不同生长阶段的不同基因型的多个国家。

16. 坑洼检测数据集

类型：目标检测

数量：700

数据集下载地址：https://www.kaggle.com/datasets/chitholian/annotated-potholes-dataset

说明：

本数据集汇总了700个在坑洼处带有3K +注释的图像，用于从道路图像中检测坑洼，检测道路地形和坑洼。

17. Linkopings交通标志数据集

类型：目标检测

数量：20000

数据集下载地址：http://www.cvl.isy.liu.se/research/datasets/traffic-signs-dataset/

说明：

通过记录超过 350 公里的瑞典高速公路和城市道路的序列，创建了一个数据集。

一个 1.3 兆像素的彩色摄像机，一个点灰色变色龙，被放置在一辆汽车的仪表板上，从前窗向外看。摄像头略微指向右侧，以便尽可能多地覆盖相关标志。该镜头的焦距为 6.5 毫米，视野约为 41 度。高速公路上的典型速度标志大约为 90 cm 宽，如果要在大约 30 m 的距离处检测到它们，则对应于大约 50 像素的大小。总共记录了超过 20 000 帧，其中每五帧被手动标记。每个标志的标签包含标志类型（人行横道、指定车道右侧、禁止站立或停车、优先道路、让路、50 公里/小时或 30 公里/小时）、能见度状态（遮挡、模糊或可见）和道路状态（是否标志是在正在行驶的道路上或在小路上）。

18. 防护装备-头盔和背心检测

类型：目标检测

数量：

数据集下载地址：https://github.com/ciber-lab/pictor-ppe

说明：

包含 774 个人群图像和 698 个网络挖掘图像。人群和网络挖掘的图像分别包含 2,496 和 2,230 个工人实例。

19. 水下垃圾检测数据集

类型：目标检测

数量：5700

数据集下载地址：https://conservancy.umn.edu/handle/11299/214366

说明：

该数据来自 J-EDI 海洋垃圾数据集。构成该数据集的视频在质量、深度、场景中的对象和使用的相机方面差异很大。它们包含许多不同类型的海洋垃圾的图像，这些图像是从现实世界环境中捕获的，提供了处于不同衰减、遮挡和过度生长状态的各种物体。此外，水的清晰度和光的质量因视频而异。这些视频经过处理以提取 5,700 张图像，这些图像构成了该数据集，所有图像都在垃圾实例、植物和动物等生物对象以及 ROV 上标有边界框。

20. 小目标检测数据集

类型：目标检测

数量：800

数据集下载地址：http://visal.cs.cityu.edu.hk/downloads/smallobjects/

说明：

从Internet（例如YouTube或Google）上的图像/视频收集的四个小物体数据集，包括4种类型的图像，可用于小物体目标检测的研究。

数据集包含四类：

fly：飞行数据集，包含600个视频帧，平均每帧86±39个物体（648×72 @ 30 fps）。32张图像用于训练（1：6：187），50张图像用于测试（301：6：600）。

honeybee：蜜蜂数据集，包含118张图像，每张图像平均有28±6个蜜蜂（640×480）。数据集被平均分配用于训练和测试集。仅前32张图像用于训练。

seagull：海鸥数据集，包含三个高分辨率图像（624×964），每个图像平均有866±107个海鸥。第一张图片用于训练，其余图片用于测试。

fish：鱼数据集，包含387帧视频数据，平均每帧56±9条鱼（300×410 @ 30 fps）。32张图像进行训练（1：3：94），65张图像进行测试（193：3：387）。

21. AI-TOD航空图像数据集

类型：目标检测

数量：28000

数据集下载地址：https://github.com/jwwangchn/AI-TOD

说明：

AI-TOD 在 28,036 张航拍图像中包含 8 个类别的 700,621 个对象实例。与现有航拍图像中的目标检测数据集相比，AI-TOD 中目标的平均大小约为 12.8 像素，远小于其他数据集。

22. iSAID航空图像大规模数据集

类型：目标检测

数量：2800

数据集下载地址：https://captain-whu.github.io/iSAID/dataset.html

说明：

iSAID 是第一个用于航空图像实例分割的基准数据集。这个大规模和密集注释的数据集包含 2,806 张高分辨率图像的 15 个类别的 655,451 个对象实例。

23. TinyPerson数据集

类型：目标检测

数量：1600

数据集下载地址：https://github.com/ucas-vg/PointTinyBenchmark/tree/master/dataset

说明：

在 TinyPerson 中有 1610 个标记图像和 759 个未标记图像（两者主要来自同一视频集），总共有 72651 个注释。

24. Deepscores 数据集

类型：目标检测

数量：1600

数据集下载地址：https://tuggeluk.github.io/deepscores/

说明：

DeepScores 包含高质量的乐谱图像，分为 300 0 000 张书面音乐，其中包含不同形状和大小的符号。

拥有近一亿个小对象，这使得我们的数据集不仅独一无二，而且是最大的公共数据集。DeepScores 带有用于对象分类、检测和语义分割的基本事实。因此，DeepScores 总体上对计算机视觉提出了相关挑战，超出了光学音乐识别 (OMR) 研究的范围。

25. 密集行人检测数据集

类型：目标检测

数量：13,382

数据集下载地址：http://www.cbsr.ia.ac.cn/users/sfzhang/WiderPerson/

说明：

WiderPerson 数据集是野外行人检测基准数据集，其图像选自广泛的场景，不再局限于交通场景。我们选择了 13,382 张图像并标记了大约 400K 带有各种遮挡的注释。我们随机选择 8000/1000/4382 图像作为训练、验证和测试子集。与 CityPersons 和 WIDER FACE 数据集类似，我们不发布测试图像的边界框基本事实。

26. 加州理工学院行人检测数据集

类型：目标检测

数量：13,382

数据集下载地址：http://www.vision.caltech.edu/Image_Datasets/CaltechPedestrians/

说明：

加州理工学院行人数据集由大约 10 小时的 640x480 30Hz 视频组成，该视频取自在城市环境中通过常规交通行驶的车辆。注释了大约 250,000 帧（在 137 个大约分钟长的片段中），总共 350,000 个边界框和 2300 个独特的行人。注释包括边界框和详细的遮挡标签之间的时间对应关系。

27. NWPU VHR-10卫星图像数据集

类型：目标检测

数量：800

数据集下载地址：http://www.escience.cn/people/gongcheng/NWPU-VHR-10.html

说明：

NWPU VHR-10 Dataset 是一个用于空间物体检测的 10 级地理遥感数据集，其拥有 650 张包含目标的图像和 150 张背景图像，共计 800 张，目标种类包括飞机、舰船、油罐、棒球场、网球场、篮球场、田径场、港口、桥梁和汽车共计 10 个类别。

28. Inria 航空影像数据集

类型：目标检测

数量：800

数据集下载地址：https://project.inria.fr/aerialimagelabeling/

说明：

Inria 航空影像标注解决了遥感中的一个核心主题：航空影像的自动像素级标注。

数据集覆盖面积 810 平方公里（405 平方公里用于训练，405 平方公里用于测试）

空间分辨率为 0.3 m 的航空正射校正彩色图像

这些图像涵盖了不同的城市住区，从人口稠密的地区到高山城镇。

29. RSOD遥感图像数据集

类型：目标检测

数量：800

数据集下载地址：https://github.com/RSIA-LIESMARS-WHU/RSOD-Dataset-

说明：

在这里插入图片描述

38. GENKI 人脸图像数据集

类型：人脸

数量：15000

数据集下载地址：https://inc.ucsd.edu/mplab/398.php

说明：

GENKI数据集是由加利福尼亚大学的机器概念实验室收集。该数据集包含GENKI-R2009a,GENKI-4K,GENKI-SZSL三个部分。GENKI-R2009a包含11159个图像，GENKI-4K包含4000个图像，分为“笑”和“不笑”两种，每个图片的人脸的尺度大小，姿势，光照变化，头的转动等都不一样，专门用于做笑脸识别。GENKI-SZSL包含3500个图像，这些图像包括广泛的背景，光照条件，地理位置，个人身份和种族等。

39. 哥伦比亚大学公众人物脸部数据库

类型：人脸

数量：58,797

数据集下载地址：https://www.cs.columbia.edu/CAVE/databases/pubfig/

说明：

PubFig Dataset 是一个大型人脸数据集，主要用于人脸识别和身份鉴定，其涵盖互联网上 200 人的 58,797 张图像，不同于大多数现有面部数据集，这些图像是在主体完全不受控制的情况下拍摄的，因此不同图像中姿势、光照、表情、场景、相机、成像条件和参数存在较大差异，该数据集类似于 UMass-Amherst 创建的 LFW 数据集。

40. CelebA 人脸数据集

类型：人脸

这些数据集可供工业界和学术界免费使用，基于这些数据集，可以开发口罩遮挡人脸的各种应用。

(1) 真实口罩人脸识别数据集：从网络爬取样本，经过整理、清洗和标注后，含525人的5千张口罩人脸、9万正常人脸。

(2) 模拟口罩人脸识别数据集：给公开数据集中的人脸戴上口罩，得到1万人、50万张人脸的模拟口罩人脸数据集。

(3)真实口罩人脸验证数据集，包括426个人的4015张人脸图像，组合成3589对相同身份和3589对不同身份的人脸样本对（口罩人脸/正常人脸）。

50. IMDB-WIKI人脸数据集

类型：人脸

数量：524230

数据集下载地址：https://data.vision.ee.ethz.ch/cvl/rrothe/imdb-wiki/

说明：

IMDB-WIKI 500k+ 是一个包含名人人脸图像、年龄、性别的数据集，图像和年龄、性别信息从 IMDB 和 WiKi 网站抓取，总计 524230 张名人人脸图像及对应的年龄和性别。其中，获取自 IMDB 的 460723 张，获取自 WiKi 的 62328 张。

51. WiderFace人脸检测数据集

类型：人脸

数量：32203

数据集下载地址：http://shuoyang1213.me/WIDERFACE/

说明：

WIDER FACE数据集是人脸检测的一个benchmark数据集，包含32203图像，以及393,703个标注人脸，其中，158,989个标注人脸位于训练集，39,496个位于验证集。每一个子集都包含3个级别的检测难度：Easy，Medium，Hard。这些人脸在尺度，姿态，光照、表情、遮挡方面都有很大的变化范围。WIDER FACE选择的图像主要来源于公开数据集WIDER。制作者来自于香港中文大学，他们选择了WIDER的61个事件类别，对于每个类别，随机选择40%10%50%作为训练、验证、测试集。

52. LFW 人像图像数据集

类型：人脸

数量：1680

数据集下载地址：http://vis-www.cs.umass.edu/lfw/#explore

说明：

该数据集是用于研究无约束面部识别问题的面部照片数据库。数据集包含从网络收集的13000多张图像。每张脸都贴上了所画的人的名字，图片中的1680人在数据集中有两个或更多不同的照片。

3. 文本识别（textg recongition）

说明：

这是在Olist Store下订单的巴西电子商务公共数据集。该数据集包含 2016 年至 2018 年在巴西多个市场进行的 10 万份订单的信息。它的功能允许从多个维度查看订单：从订单状态、价格、付款和货运绩效到客户位置、产品属性，最后是客户撰写的评论。这是真实的商业数据，已匿名，评论文本中对公司和合作伙伴的引用已替换为《权力的游戏》大家族的名称。

59. Top1000的Github存储库数据集

类型：文本识别

数量：

数据集下载地址：https://www.kaggle.com/datasets/anshulmehtakaggl/top-1000-github-repositories-for-multiple-domains

说明：

关于 Github 上的 1000 个最受欢迎的关键字存储库的详尽数据

4. 图像分类（image classification）

在这里插入图片描述

60. MNIST 手写数字图像数据集

类型：分类

数量：70000

数据集下载地址： http://yann.lecun.com/exdb/mnist/

说明：

MNIST数据集是一个手写阿拉伯数字图像识别数据集，图片分辨率为 20x20 灰度图图片，包含‘0 - 9’ 十组手写手写阿拉伯数字的图片。其中，训练样本 60000 ，测试样本 10000，数据为图片的像素点值，作者已经对数据集进行了压缩。

61. GTSRB德国交通标志数据集

类型：分类

数量：50000

67. Stanford 汽车图片数据

类型：图像分类

数量：16,185

数据集下载地址： ai.stanford.edu/~jkrause/cars/car_dataset.html

说明：

Cars 数据集包含 196 类汽车的 16,185 张图像。数据分为 8,144 个训练图像和 8,041 个测试图像，其中每个类别大致按 50-50 分割。课程通常在品牌、型号、年份级别，例如 2012 Tesla Model S 或 2012 BMW M3 coupe。

68. 花卉数据集

74. 商标数据集

类型：图像分类

数量：167,140

数据集下载地址：https://github.com/msn199959/Logo-2k-plus-Dataset

说明：

构建了一个大规模的 logo 数据集 Logo-2K+，它涵盖了来自真实世界 logo 图像的各种 logo 类别。我们生成的徽标数据集包含 167,140 张图像，具有 10 个根类别和 2,341 个类别。

75. 飞机数据集

类型：图像分类

数量：10000

数据集下载地址：https://www.kaggle.com/datasets/seryouxblaster764/fgvc-aircraft

说明：

数据集包括 28个纹理类，每类160个独特纹理面片。数据包括包括素色布和花色布两类，其中，素色布数据约8000张；花色布数据约12000张。

本数据涵盖了纺织业中布匹的各类重要瑕疵，每张图片含一个或多种瑕疵。

85. 东北大学带钢表面缺陷数据集

类型：缺陷检测

数量：1800

数据集下载地址：http://faculty.neu.edu.cn/songkechen/zh_CN/zdylm/263270/list/

说明：

数据集收集了夹杂、划痕、压入氧化皮、裂纹、麻点和斑块6种缺陷，每种缺陷300张，图像尺寸为200×200。

数据集包括分类和目标检测两部分，不过目标检测的标注中有少量错误，需要注意。

类型：缺陷检测

数量：

数据集下载地址：https://gitcode.net/mirrors/abin24/Magnetic-tile-defect-datasets.?utm_source=csdn_github_accelerator

说明：

中国科学院自动所一个课题组收集的数据集，是“Saliency of magnetic tile surface defects”这篇论文的数据集。收集了6种常见磁瓦缺陷的图像，并做了语义分割的标注。

90. RSDDs铁轨表面缺陷数据集

类型：缺陷检测

数量：200

数据集下载地址：http://icn.bjtu.edu.cn/Visint/resources/RSDDs.aspx

说明：

RSDDs数据集包含两种类型的数据集：第一种是从快车道捕获的I型RSDDs数据集，其中包含67个具有挑战性的图像。第二个是从普通/重型运输轨道捕获的II型RSDDs数据集，其中包含128个具有挑战性的图像。

两个数据集的每幅图像至少包含一个缺陷，并且背景复杂且噪声很大。

RSDDs数据集中的这些缺陷已由一些专业的人类观察员在轨道表面检查领域进行了标记。

91. 印刷电路板（PCB）瑕疵数据集

类型：缺陷检测

数量：1386

数据集下载地址：https://robotics.pkusz.edu.cn/resources/dataset/

说明：

这是一个公共的合成PCB数据集，由北京大学发布，其中包含1386张图像以及6种缺陷（缺失孔，鼠咬坏，开路，短路，杂散，伪铜），用于检测，分类和配准任务。

6. 医学影像（medical image）

说明：

本数据集收集了来自身体各部位的X光图片。

多分类问题。自动识别图像中的身体部位，从而可以创建更多数据集和部署管道。

102. 眼病深度学习数据集

类型：医学影像

数量：

数据集下载地址：https://www.kaggle.com/datasets/bongsang/eye-disease-deep-learning-dataset

说明：

本数据集包含712张片状角膜溃疡的眼部染色图像。

该数据集的标签由 3 个类别、5 个类型和 5 个等级组成。可以是75个多标签。

103. 膝关节 X 射线图像数据集

类型：医学影像

111. 手部姿势关键点检测数据集

类型：关键点检测

数量：

数据集下载地址：http://www.rovit.ua.es/dataset/mhpdataset/#citation

说明：

数据集由序列构成。在每个序列中，您都可以找到组成它的帧。一个帧由4个彩色图像、4组投影在每个图像平面中的2D关节、4个边界框、1组Leap Motion Controller提供的3D点和4组重新投影到每个相机坐标帧的3D点组成

112. 动物姿势数据集

类型：关键点检测

数量：4000

数据集下载地址：https://github.com/switchablenorms/DeepFashion2

说明：

该数据集提供了五个类别的动物姿势注释：狗、猫、牛、马、羊，在4,000 多张图像中总共有6,000多个实例。此外，该数据集还包含其他7 个动物类别的边界框注释。在论文中查找详细信息。

该数据集一共标注了 20 个关键点：两只眼睛、喉咙、鼻子、马肩隆、两个耳根、尾根、四个肘部、四个膝盖、四个爪子。

113. 电影人物关节关键点数据集

类型：关键点检测

数量：5000

数据集下载地址：https://bensapp.github.io/flic-dataset.html

说明：

本文从流行的好莱坞电影中自动收集了5003个图像数据集。这些图像是通过在30部电影的每10帧上运行一个最先进的人检测器获得的

114. MPIIGaze数据集

类型：关键点检测

数量：213659

数据集下载地址：https://www.mpi-inf.mpg.de/departments/computer-vision-and-machine-learning/research/gaze-based-human-computer-interaction/appearance-based-gaze-estimation-in-the-wild

说明：

数据集包含我们在三个多月的日常笔记本电脑使用过程中从15名参与者收集的213659张图像。在外观和照明方面，我们的数据集比现有的数据集变化更大。

115. 人体足部关键点数据集

类型：关键点检测

数量：

数据集下载地址：https://cmu-perceptual-computing-lab.github.io/foot_keypoint_dataset/

说明：

MPII 数据集标注了脚踝、膝盖、臀部、肩膀、肘部、手腕、颈部、躯干和头顶，而 COCO 还包括一些面部关键点。对于这两个数据集，足部注释仅限于脚踝位置。COCO 数据集中的一小部分脚实例使用 Clickworker 平台进行标记。它分为来自 COCO 训练集的 14K 注释和来自验证集的 545 个注释。

类型：动作识别

数量：

数据集下载地址： https://www3.cs.stonybrook.edu/~kyun/research/kinect_interaction/index.html

说明：

SBU Kinect Interaction 创建了一个描述两个人交互的复杂人类活动数据集，包括同步视频、深度和运动捕获数据。此外，在通过支持向量机（SVM）实时检测交互活动的背景下，我们使用数据集评估通常用于索引和检索运动捕捉数据的各种特征。

120. FineDiving 跳水数据集

类型：动作识别

数量：

数据集下载地址： https://finediving.ivg-research.xyz/

说明：

收集了奥运会、世界杯、世锦赛以及欧锦赛的跳水项目比赛视频。每个比赛视频都提供了丰富的内容，包括所有运动员的跳水记录、不同视角的慢速回放等。

121. ALOV300++跟踪数据集

类型：目标跟踪

数量：

数据集下载地址：https://aimagelab.ing.unimore.it/dsm/

说明：

ALOV++，Amsterdam Library of Ordinary Videos for tracking 是一个物体追踪视频数据，旨在对不同的光线、通透度、泛着条件、背景杂乱程度、焦距下的相似物体的追踪

11. 姿态估计（pose estimation）

在这里插入图片描述

122. MPII人体模型数据集

类型：姿态估计

数量：10000

数据集下载地址：https://humanshape.mpi-inf.mpg.de/

说明：

该数据集包含通过在Google Image Search中键入常见的名字从web上收集的人们的图像。每个正面的眼睛、鼻子和嘴巴中心的坐标都在地面真相文件中提供。此信息可用于对齐和裁剪人脸，或作为人脸检测算法的基本事实。该数据集有10524张不同分辨率和不同设置的人脸，例如肖像图像、人群等。侧面人脸或非常低分辨率的人脸没有标签。

123. MPII人类姿态数据集

类型：姿态估计

数量：40000

数据集下载地址：http://human-pose.mpi-inf.mpg.de/#overview

说明：

MPII 人体姿态数据集是用于评估人体关节姿势估计的最先进基准。该数据集包括大约 25,000 张图像，其中包含超过 40,000 个带有注释身体关节的人。这些图像是使用已建立的人类日常活动分类法系统收集的。总的来说，数据集涵盖了 410 项人类活动，每个图像都提供了一个活动标签。每张图像都是从 YouTube 视频中提取的，并提供前后未注释的帧。此外，测试集有更丰富的注释，包括身体部位遮挡和 3D 躯干和头部方向。

124. KTH 多视图足球数据集

类型：姿态估计

数量：771

数据集下载地址：https://www.csc.kth.se/~vahidk/football_data.html

说明：

收集了一个带有注释关节的足球运动员数据集，可用于多视图重建。数据集包括：

771张足球运动员的照片

在 257 个时间实例中从 3 个视图中获取的图像

14 个带注释的身体关节

125. 宾夕法尼亚动作数据集

类型：姿态估计

数量：2326

数据集下载地址：http://dreamdragon.github.io/PennAction/

说明：

Penn Action Dataset（宾夕法尼亚大学）包含 15 个不同动作的 2326 个视频序列以及每个序列的人类联合注释。

类型：姿态估计

数量：1010万

数据集下载地址： https://google.github.io/aistplusplus_dataset/factsfigures.html

说明：

AIST++ 舞蹈动作数据集是从 AIST 舞蹈视频数据库构建的。对于多视图视频，设计了一个精心设计的管道来估计相机参数、3D 人体关键点和 3D 人体舞蹈动作序列：

它为 1010 万张图像提供 3D 人体关键点注释和相机参数，涵盖 9 个视图中的 30 个不同主题。这些属性使其成为具有 3D 人体关键点注释的最大和最丰富的现有数据集。它还包含 1,408 个 3D 人类舞蹈动作序列，表示为关节旋转以及根轨迹。舞蹈动作平均分布在 10 种舞蹈流派中，有数百种编舞。运动持续时间从 7.4 秒不等。至 48.0 秒。所有的舞蹈动作都有相应的音乐。

133. HiEve数据集

类型：姿态估计

数量：

数据集下载地址： Human in Events

说明：

该数据集专注于在各种人群和复杂事件中进行非常具有挑战性和现实性的以人为中心的分析任务，包括地铁上下车、碰撞、战斗和地震逃生。并且具有大规模和密集注释的标签，涵盖了以人为中心的分析中的广泛任务。

该数据集具有大规模且注释密集的标签，涵盖了以人为中心的分析中的广泛任务。

我们的HiEve数据集包括当前最大数量的姿势（>1M）、最大数量的复杂事件动作标签（>56k）以及最大数量的长期轨迹（平均轨迹长度>480）。

12. 自动驾驶（automatic drive）

13. RGB-T

148. HFUT-Lytro数据集

类型：RGBT

数量：

数据集下载地址：https://dl.acm.org/doi/10.1145/3107956

说明：15000

由255个光场组成，每个光场图像生成的图像范围从53到64个，其中跨越了多个显著性检测挑战，如遮挡、杂乱背景和外观变化。

149. DUTLF-V2

类型：RGBT

数量：4200

数据集下载地址：https://github.com/OIPLab-DUT/DUTLF-V2

说明：

由于具有强大的三维信息捕捉能力，光场数据为显著性检测算法提供了更为有力的支持。

多功能数据集，其中包含了102类目标、共4202个样本，可以有效支持基于RGB、RGB-D和光场数据的显著性检测算法。

150. ReDWeb-S

类型：RGBT

数量：3200

数据集下载地址：https://github.com/nnizhang/SMAC

说明：

它共有 3179 张图像，具有各种真实世界场景和高质量的深度图。我们将数据集分成包含 2179 个 RGB-D 图像对的训练集和包含剩余 1000 个图像对的测试集。

更多内容，详见：海量数据集，https://www.cvmart.net/dataSets

版权声明：

youcans@xupt 原创作品，转载必须标注原文链接：(https://blog.csdn.net/youcans/article/details/127244865)

Copyright 2022 youcans, XUPT

Crated：2022-10-10

上一篇： AI大模型学习笔记之二：什么是 AI 大模型的训练和推理？

下一篇：斯坦福大学Mobile ALOHA——一款革命性的家政机器人

本文标签

12大类150个图像处理和深度学习开源数据集

声明

本文内容仅代表作者观点，或转载于其他网站，本站不以此文作为商业用途
如有涉及侵权，请联系本站进行删除
转载本站原创文章，请注明来源及作者。