DataWhale—AI夏令营—CV图像方向 DeepFake Task3

ARbing_an 2024-07-31 17:01:02 阅读 59

1.DeepFake背景知识

Deepfake是一种使用人工智能技术生成的伪造媒体,特别是视频和音频,它们看起来或听起来非常真实,但实际上是由计算机生成的。这种技术通常涉及到深度学习算法,特别是生成对抗网络(GANs),它们能够学习真实数据的特征,并生成新的、逼真的数据。

Deepfake技术虽然在多个领域展现出其创新潜力,但其滥用也带来了一系列严重的危害。在政治领域,Deepfake可能被用来制造假新闻或操纵舆论,影响选举结果和政治稳定。经济上,它可能破坏企业形象,引发市场恐慌,甚至操纵股市。法律体系也面临挑战,因为伪造的证据可能误导司法判断。此外,深度伪造技术还可能加剧身份盗窃的风险,成为恐怖分子的新工具,煽动暴力和社会动荡,威胁国家安全。

一句话说明白:Deepfake技术是通过AI的生成图像来伪造证据,从而欺骗人类,给出错误的判断。

2.DeepFake的识别增强

Task3是在前两个任务的基础上进行增强和升级,在Task1中,我通过原先给好的代码成功运行并且获得结果如下:

显然,我们的最后识别率只有0.52。非常的不准确,我们相当于是说判断正确的概率是五五开。而且很有可能两次的运行结果都是相反的,这是非常不理想的。因此,我们需要对模型进行进一步的训练,使其能够更好的进行识别,我们来介绍一下具体的增强手段。

2.1模型的增强

数据增强是一种在机器学习和深度学习领域常用的技术,尤其是在处理图像和视频数据时。数据增强的目的是通过人工方式增加训练数据的多样性,从而提高模型的泛化能力,使其能够在未见过的数据上表现得更好。数据增强涉及对原始数据进行一系列的变换操作,生成新的训练样本。这些变换模拟了真实世界中的变化,对于图像而言,数据增强包括例如视角、光照、遮挡等情况,使得模型能够学习到更加鲁棒的特征表示。

说白了一句话:将图像进行反转,折叠,重叠,切割等等手段来帮助算法更深层的理解真实的图像。

毕竟真实的照片无论是反转还是切割,都不能改变其真实性。与此相同的是,无论生成的假图像怎么处理,都不能改变其假图像的本质。

而增强过程是指我们帮助算法认证处理这些被修改过的图像。

2.2增强方法

图像大小调整:使用<code>transforms.Resize((256, 256))将所有图像调整到256x256像素的尺寸,这有助于确保输入数据的一致性。

随机水平翻转:transforms.RandomHorizontalFlip()随机地水平翻转图像,这种变换可以模拟物体在不同方向上的观察,从而增强模型的泛化能力。

随机垂直翻转:transforms.RandomVerticalFlip()随机地垂直翻转图像,这同样是为了增加数据多样性,让模型能够学习到不同视角下的特征。

转换为张量:transforms.ToTensor()将图像数据转换为PyTorch的Tensor格式,这是在深度学习中处理图像数据的常用格式。

归一化:transforms.Normalize([0.485, 0.456, 0.406], [0.229, 0.224, 0.225])对图像进行归一化处理,这里的均值和标准差是根据ImageNet数据集计算得出的,用于将图像像素值标准化,这有助于模型的训练稳定性和收敛速度。

通过这些方法,我们可以对图像进行各种变化,但是并不改变图像的真实性!举个例子:一张真纸币我们无论如何折叠,揉搓,只要不改变其本质(涂抹,剪切),这张纸币都是真纸币。

比如说:几何变换

调整大小: Resize可以将图像调整到指定的大小。

随机裁剪: RandomCropRandomResizedCrop可以随机裁剪图像。

中心裁剪: CenterCrop从图像的中心裁剪出指定大小。

五裁剪和十裁剪: FiveCropTenCrop分别裁剪出图像的四个角和中心区域。

翻转: RandomHorizontalFlipRandomVerticalFlip可以水平或垂直翻转图像。

旋转: RandomRotation可以随机旋转图像。

仿射变换: RandomAffine可以进行随机的仿射变换。

透视变换: RandomPerspective可以进行随机的透视变换

又比方说:颜色变换

颜色抖动: ColorJitter可以随机改变图像的亮度、对比度、饱和度和色调。

灰度化: GrayscaleRandomGrayscale可以将图像转换为灰度图。

高斯模糊: GaussianBlur可以对图像进行高斯模糊。

颜色反转: RandomInvert可以随机反转图像的颜色。

颜色 posterize: RandomPosterize可以减少图像中每个颜色通道的位数。

颜色 solarize: RandomSolarize可以反转图像中所有高于阈值的像素值。

那有人说了,颜色都改变了,岂不是图像本质就已经被改变了吗?其实不然,你完全可以理解成:对同样一张照片,使用了不同的滤镜。这是完全不改变其真实有效性的!

3.小结

经过7天的学习,我已经对深度学习和机器学习有了一个扫盲式的理解,非常感谢DataWhale举办的这次活动,让我们这些小白也能体验到机器学习的魅力



声明

本文内容仅代表作者观点,或转载于其他网站,本站不以此文作为商业用途
如有涉及侵权,请联系本站进行删除
转载本站原创文章,请注明来源及作者。