【人脸识别】数据集宝藏合集,速看!

计算机科研之友(Friend) 2024-10-06 16:31:01 阅读 99

本文将为您介绍10个经典、热门的数据集,希望对您在选择适合的数据集时有所帮助。

1

26,090张人脸肤质缺陷采集数据【数据堂】

发布方:

数据堂(北京)科技股份有限公司

发布时间:

2021

简介:

26,090张人脸肤质缺陷采集数据包含痘痘、痘印、色斑、皱纹、黑眼圈五种肤质缺陷的人脸。26,090张人脸肤质缺陷采集数据可用于肤质检测、人脸识别等任务

下载地址:

https://www.datatang.com/dataset/1052?source=openxlab

2

LFW (Labeled Faces in the Wild)

发布方:

马萨诸塞大学

发布时间:

2007

简介:

Labeled Faces in the Wild,是一个人脸照片数据库,旨在研究无约束的人脸识别问题。该数据集包含从网络收集的超过 13,000 张人脸图像。每张脸都标有图中人物的名字。照片中的 1680 人在数据集中有两张或更多张不同的照片。这些人脸的唯一限制是它们是由 Viola-Jones 人脸检测器检测到的。更多细节可以在下面的技术报告中找到。

下载地址:

http://vis-www.cs.umass.edu/lfw/

论文地址:

http://vis-www.cs.umass.edu/lfw/lfw.pdf

3

MALF (Multi-Attribute Labelled Faces)

发布方:

中国科学院·中国科学院自动研究所

发布时间:

2015

简介:

该数据集包含从 Internet 收集的 5,250 张图像和 11,931 个带注释的人脸。 每个面都包含以下注释: 方形边界框; yaw、pitch、roll的位姿变形等级(小、中、大); 'ignore' 标记小于 20x20 或极难识别的人脸(总共 838 个人脸,约占 7%); 其他面部属性:性别(女、男、未知)、isWearingGlasses、isOccluded 和 isExaggeratedExpression。

下载地址:

http://www.cbsr.ia.ac.cn/faceevaluation/

论文地址:

http://www.cbsr.ia.ac.cn/faceevaluation/faceevaluation15.pdf

4

VoxCeleb2

发布方:

牛津大学

发布时间:

2018

简介:

VoxCeleb2 是一个从开源媒体自动获得的大规模说话人识别数据集。 VoxCeleb2 包含来自 6k 多个扬声器的超过 100 万个话语。由于数据集是“在野外”收集的,语音片段被现实世界的噪音破坏,包括笑声、串音、频道效果、音乐和其他声音。该数据集也是多语言的,来自 145 个不同国籍的演讲者,涵盖了广泛的口音、年龄、种族和语言。该数据集是视听的,因此对于许多其他应用也很有用,例如 - 视觉语音合成、语音分离、从人脸到语音的跨模态转换(反之亦然)以及从视频中训练人脸识别以补充现有的人脸识别数据集。

下载地址:

https://www.robots.ox.ac.uk/~vgg/data/voxceleb/vox2.html

论文地址:

https://arxiv.org/pdf/1806.05622v2.pdf

5

IMDb-Face

发布方:

南洋理工大学·商汤科技研究所·University of California, San Diego

发布时间:

2018

简介:

IMDb-Face 是用于人脸识别研究的大规模噪声控制数据集。该数据集包含大约 170 万张面孔、59k 个身份,这些都是从 200 万张原始图像中手动清除的。所有图片均来自 IMDb 网站。

下载地址:

https://github.com/fwang91/IMDb-Face

论文地址:

https://arxiv.org/pdf/1807.11649v1.pdf

6

YouTube Faces

发布方:

特拉维夫大学

发布时间:

2011

简介:

YouTube Faces Dataset 是一个人脸视频数据库,用于研究视频中不受约束的人脸识别问题。数据集包含来自 1,595 个主题的 3,425 个视频,全部来自 YouTube,每个主题大约有 2.15 个视频。最短的剪辑持续了 48 帧,最长的为 6070 帧,剪辑的平均长度为 181.3 帧。 YouTube Faces Dataset由特拉维夫大学于2011年发表,相关论文包括《Lior Wolf, Tal Hassner and Itay Maoz Face Recognition in Unconstrained Videos with Matched Background Similarity》。

下载地址:

http://www.cs.tau.ac.il/~wolf/ytfaces/

论文地址:

https://arxiv.org/pdf/1902.03804v1.pdf

7

CACD

发布方:

马里兰大学

发布时间:

2014

简介:

跨年龄名人数据集是用于跨年龄人脸识别和检索的数据集。它包含 2,000 位名人的 163,446 张图像。该数据集于 2014 年由马里兰大学计算机科学系发表,论文名为 cross-age Reference Coding for Age-invariant Face Recognition and Retrieval。

下载地址:

http://bcsiriuschen.github.io/CARC/

8

Expression in-the-Wild (ExpW)

发布方:

Chinese University of Hong Kong

发布时间:

2015

简介:

我们建立了一个名为 Expression in-the-Wild (ExpW) 数据集的新数据库,其中包含 91,793 个手动标记有表情的人脸。每个人脸图像都被手动注释为七种基本表情类别之一:愤怒、厌恶、恐惧、快乐、悲伤、惊讶或中性。与许多现有数据库相比,ExpW 中的图像数量更大,人脸变化更多样化。

下载地址:

http://mmlab.ie.cuhk.edu.hk/projects/socialrelation/index.html

论文地址:

https://arxiv.org/pdf/1609.06426v3.pdf

9

RenderMe-360

发布方:

上海人工智能实验室

发布时间:

2023-05-24

简介:

RenFace是一个大规模多视角人脸高清视频数据集,包含多样的人脸表情、丰富的细粒度发型发色,同时也包含音素均衡的说话视频。可应用于:2D/3D数字人脸生成、人脸重建捕捉等领域。

下载地址:

https://renderme-360.github.io/; https://openxdlab.org.cn/home

10

CPLFW(Cross-Pose LFW)

发布方: 北京邮电大学

发布时间:2018

简介:

Labeled Faces in the Wild (LFW) 的改造,这是用于无约束人脸验证的事实上的标准测试平台。 构建 CPLFW 基准的背后有以下三个动机: 1.建立一个相对难度更大的数据库来评估现实世界人脸验证的性能,以便充分证明几种人脸验证方法的有效性。 2.继续深入研究LFW,更加现实地考虑姿态类内变化,促进无约束情况下跨姿态人脸验证的研究。 CPLFW 的挑战强调位姿差异以进一步扩大类内方差。此外,故意选择负面对以避免不同的性别或种族。 CPLFW 同时考虑了大的类内方差和微小的类间方差。 3.保持数据量,人脸验证协议在LFW中提供“相同/不同”的基准和相同的身份,因此可以很容易地应用CPLFW来评估人脸验证的性能。

下载地址:

http://whdeng.cn/CPLFW/index.html

 论文地址:

http://www.whdeng.cn/CPLFW/Cross-Pose-LFW.pdf

11

300-W

发布方:伦敦帝国理工学院

发布时间:2013

简介:300-W 是一个人脸数据集,由 300 张室内和 300 张室外野外图像组成。它涵盖了身份、表情、照明条件、姿势、遮挡和面部大小的大量变化。这些图片是通过查询“派对”、“会议”、“抗议”、“足球”和“名人”等从 google.com 下载的。与其他野外数据集相比,300-W 数据库包含更大比例的部分遮挡图像,并且涵盖的表情比常见的“中性”或“微笑”(例如“惊喜”或“尖叫”)更多.使用半自动方法用 68 点标记对图像进行注释。数据库中的图像经过精心挑选,因此它们代表了在完全不受约束的条件下具有挑战性但自然的人脸实例的特征样本。因此,在 300-W 数据库上实现准确性能的方法可以在大多数实际情况下展示相同的准确度。数据库中的许多图像包含不止一张带注释的人脸(293 张带有 1 张人脸的图像,53 张带有 2 张人脸的图像和 53 张带有 [3, 7] 人脸的图像)。因此,该数据库包含 600 个带注释的人脸实例,但包含 399 个独特的图像。最后,有各种各样的脸型。具体来说,49.3% 的人脸大小在 [48.6k, 2.0M] 范围内,整体平均大小为 85k(约 292 × 292)像素。

下载地址:

https://ibug.doc.ic.ac.uk/resources/300-W/

 论文地址:

https://ibug.doc.ic.ac.uk/media/uploads/documents/sagonas_iccv_2013_300_w.pdf

12

UTKFace

发布方:

田纳西大学

发布时间:2017

简介:UTKFace 数据集是一个大规模的人脸数据集,年龄跨度长(从 0 到 116 岁)。该数据集包含超过 20,000 张带有年龄、性别和种族注释的人脸图像。这些图像涵盖了姿势、面部表情、照明、遮挡、分辨率等方面的巨大变化。该数据集可用于各种任务,例如面部检测、年龄估计、年龄进展/回归、地标定位等。

下载地址:

https://susanqq.github.io/UTKFace/

 论文地址:

https://arxiv.org/pdf/1702.08423v2.pdf

13

WFLW (Wider Facial Landmarks in the Wild)

发布方:

清华大学·商汤科技研究所·亚马逊

发布时间:2018

简介:

Wider Facial Landmarks in-the-wild (WFLW) 包含 10000 个人脸(7500 个用于训练,2500 个用于测试)和 98 个完全手动注释的地标。除了地标标注外,新的数据集还包括丰富的属性标注,即遮挡、姿势、化妆、照明、模糊和表达,用于对现有算法的综合分析。与之前的数据集相比,所提出的数据集中的人脸在表情、姿势和遮挡方面引入了很大的变化。

下载地址:

https://wywu.github.io/projects/LAB/WFLW.html

 论文地址:

https://arxiv.org/pdf/1805.10483v1.pdf

14

FG-NET

发布方:

伦敦大学·Chinese University of Hong Kong

发布时间:2013

简介:

FGNet 是一个用于跨年龄的年龄估计和人脸识别的数据集。它由 82 人的 1,002 张图像组成,年龄范围从 0 到 69,年龄差距高达 45 岁

下载地址:

https://yanweifu.github.io/FG_NET_data/

 论文地址:

http://www.eecs.qmul.ac.uk/~sgg/papers/ChenEtAl_CVPR2013.pdf

 温馨  小贴士

如有您想了解的计算机方向数据集

请联系我们

免费为您提供数据集搜索服务



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。