当前位置：首页 > news >正文

动物摄影网站懂得做网站还可以做什么兼职

news 2025/11/5 18:17:13

动物摄影网站,懂得做网站还可以做什么兼职,杭州设计公司老总被点火,建网站深圳作者 | 搜索内容技术部导读深度伪造检测算法无法检出未知伪造算法生成的攻击数据。以往算法采取手动建模伪造特征的方式提升模型泛化性#xff0c;然而这种方式限制了算法可行域#xff0c;影响了模型泛化性进一步提升#xff0c;同时这类方法参数量巨大#xff0c;无法满… 作者 | 搜索内容技术部导读深度伪造检测算法无法检出未知伪造算法生成的攻击数据。以往算法采取手动建模伪造特征的方式提升模型泛化性然而这种方式限制了算法可行域影响了模型泛化性进一步提升同时这类方法参数量巨大无法满足工业实时检测要求。本文发现过往采取二分类训练检测算法的方式使模型过多关注了样本中的用户身份信息从而导致深伪检测模型无法检出未知伪造数据我们称其为 “隐式的身份泄漏现象”。为解决此问题本文提出了一种忽略样本身份特征的深度伪造检测算法。实验证明当抑制了模型对图片身份信息的学习模型可以自主学习不同伪造特征之间所存在的共性特征即使基于最简单的二分类模型检测精度也远超现有业界同期算法。全文4358字预计阅读时间11分钟。 01 导论近来伴随 AIGC 的快速发展基于 AIGC 技术的人脸编辑算法开始在互联网兴起。其在增加用户使用趣味性同时也降低了借助算法进行伪造攻击的技术门槛。攻击者借助面部编辑利用伪造身份在互联网传播虚假新闻制作恶作剧造成恶劣影响。深伪检测算法旨在检出这类伪造数据减少人脸伪造技术带来的负面效应。现有算法在已知的伪造数据中取得了极高的检测精度。然而新的人脸伪造技术总是层出不穷这部分检测模型在面对未知的伪造算法时精度严重不足。此前关于深伪检测模型泛化性的研究主要集中在两方面。一种是采用手动建模伪造特征的方式。它们假设不同伪造图片存在某种共有的伪造特征并训练模型对其进行检测。然而这一假设的特征往往反映的是人类对于伪造特征的主观理解并不能体现数据中真实的多种不同伪造特征的共性特征故并无法从根本上提升模型的泛化性。另一种方法则是通过简单的二分类模型进行检测。二分类模型可以自主从数据中学习伪造特征分布但很容易出现过拟合的问题一定程度上限制其泛化能力。为了解决这一问题本文深入分析现有二分类模型并期望提出构建一个简洁、鲁棒的深伪检测器。本文发现现有二分类模型泛化性较差的主要原因在于图片身份信息的干扰。如图1 (a) 所示伪造图像Fake Image是通过将原始图像Source Image的身份更换为目标图像Target Image所得来。伪造目标图像New Target Image则是基于伪造图像和目标图像编辑得来。可以看出伪造目标图像在图像伪造过程中丢失了部分身份信息其身份特征同原始目标图像并不相同。如图1b所示伪造过程中身份信息的丢失就导致了深度伪造检测模型训练数据集中真假数据集合间存在一个基于身份特征的分界面Identity Boundary。基于此训练的二分类模型会关注图像中的身份特征当模型无法检出图像中的伪造特征时会被图像身份信息误导做出错误判定。我们称这种现象为“隐式的身份泄漏现象”。为削减“隐式的身份泄漏现象” 的负面影响我们进一步提出了忽略身份特征的深度伪造检测器。简而言之只要迫使伪造检测模型关注图像中的局部信息那么算法就无法借助全局五官特征来捕获人脸的身份信息进而就削减了身份特征对伪造检测任务的负面影响。模型共由伪造区域检测器和多尺度面部伪造方法两部分组成。其中伪造区域检测器采取局部检测方式避免了全局身份信息影响同时迫使模型从不同局部伪造区域中学习共性特征。多尺度面部伪造方法通过对面部进行局部伪造为伪造区域检测器提供了训练所需的标注信息。实验结果证明避免图片身份信息的影响后忽略身份特征的深度伪造检测器即便使用最简单的二分类模型其精度也可远超业界同期算法。该模型为未来研究深伪检测模型泛化性问题提供了一个新的方向同时也为模型真实场景的部署提供了一个更为简单有效的方案。 02 隐式的身份泄漏现象隐式的身份泄漏现象特指深伪检测模型在训练过程中捕捉到了训练数据集中存在的身份特征分界面。尽管这种特征会在同源数据测试阶段强化真伪数据间的特征差异但在面对新的伪造数据时模型无法捕捉伪造特征分布就开始被曾学习到的身份特征所误导。为此我们构建了线性身份分类实验来验证基于二分类的深伪检测算法在训练阶段捕捉到了身份特征信息同时提出了量化指标来精确度量这种现象在同源数据测试和交叉数据测试未见过的伪造方法过程中对算法精度的影响。假设一深伪检测算法在训练过程中用到了身份特征完成真假判定我们基于不同网络结构不同的实验配置进行了线性身份分类实验。模型先在深伪检测训练数据集进行伪造检测任务训练而后固定主干模型参数追加线性分类器Fully Connection Layer进行身份分类。如图2 a, b, c所示我们分别在深伪数据集 Celeb-DF 和 FF 以及人脸识别数据集 LFW 上进行实验。实验结果发现深伪检测算法在数据集上不同程度收敛同时分类准确度皆高于 50%证明了模型的特征空间具备身份信息可用于身份识别任务。进而验证了深伪检测算法在训练过程中用到了身份特征完成真假判定这一假设。假设二身份特征在交叉数据测试阶段误导模型限制了算法泛化性我们认为通常身份特征对伪造检测任务的贡献表现在局部特征联合的全局交互得分。具体而言我们通常难以仅基于人的鼻子眼睛和嘴这些局部五官特征判定人的身份。但是当我们基于人的全局五官进行身份判定任务就变得简单许多。在这里基于局部判定身份就可以看作是局部特征在伪造检测任务中的独立得分全局五官身份判定可以理解为局部特征拼接在一起时所形成的全局交互得分。为验证当前假设我们引入 Shapley Value 对局部特征独立伪造检测得分和全局交互伪造检测得分进行解耦并分析全局交互得分仅基于身份特征做伪造检测在不同测试集上的精度AUC。实验结果如上身份特征在同源数据FF测试阶段都表现出了较高的精度81.53%, 但用于交叉数据Celeb-DF测试时对判别结果产生负面影响。证明了身份特征在交叉数据测试阶段误导模型限制了算法泛化性这一假设。 03 忽略样本身份特征的深伪检测算法本文提出了一种简洁、鲁棒的深伪检测器 —— 忽略样本身份特征的深伪检测算法。算法共由局部伪造区域检测模块和多尺度面部伪造方法组成。其中局部伪造区域检测模块通过检测样本局部区域中是否含有伪造特征过滤伪造样本以此避免模型关注样本的全局身份信息。多尺度面部伪造方法用于生成带有伪造区域位置信息的伪造样本以支持局部伪造区域检测模块训练。 3.1 局部伪造特征检测模块我们期望模型可以根据图片中的Artifact区域进行深伪检测而非利用其它无关的身份信息。为此我们设计了局部伪造区域检测模块用于定位和判别图片中存在伪造特征的局部区域以此避免全局I身份信息干扰。如图所示局部伪造区域检测模块的输入为传统二分类模型提取的图片特征输出为图片中伪造特征存在的区域。同检测模型相似局部伪造区域检测模块在主干网络后追加了四层卷积层并将图片划分为多尺寸锚点。局部伪造区域检测模块通过对这些锚点进行分类可以有效学习到图片中真实区域与伪造区域之间的差别。此外我们将主干网络输出结果经全局池化后追加在局部伪造区域检测模块输出结果中从而进一步丰富提取特征的信息。综上通过定位图片中伪造特征存在的区域模型可以较为精准地学习到多种伪造特征的共性特征同时避免受到图片全局身份信息的影响有效提升模型的泛化能力。 3.2 多尺度面部伪造方法过往数据集中不包含图片中伪造区域的标注我们提出多尺度面部伪造方法其利用多尺度的滑动窗口和不同的融合方式生成带有伪造特征区域标注的伪造图片同时进一步丰富训练集中伪造特征的信息。多尺度面部伪造方法的流程如图所示。针对一对源图片和伪造图片多尺度面部伪造方法使用不同尺度的滑动窗口定位伪造的区域并生成指示局部换脸区域的0-1 Mask。输入的源图片和伪造图片会结合0-1 Mask并采用不同的融合方式生成新的伪造图片。其共包括两种不同的处理方式全局交换和局部交换。全局交换生成的Mask包含整个脸部区域而局部交换的Mask只覆盖伪造特征最显著的区域。我们计算源图片和对应伪造图片的 DSSIM并借助滑动窗口定位伪造图片与原图之间差异性最大的局部区域并定义这一区域为伪造特征最显著的区域。该区域DSSIM最大被改动的信息最多也就最可能含有伪造特征。综上通过多尺度的滑动窗口和不同的融合方式多尺度面部伪造方法可以生成带有伪造区域标注的伪造图片进一步丰富训练集中伪造特征的信息最终帮助模型学习共性伪造特征。 04 实验部分 4.1 隐式身份泄漏现象验证实验为验证隐式身份泄漏现象我们从数据集中随机选取了来自10个不同ID的100张样本借助在FF数据集中训练的模型提取高维特征并使用t-SNE将其投影到二维进行可视化(L2正则化后)。如图所示每个点表示一张图片的特征不同颜色的点表示不同身份图片的特征。如图b所示二分类模型在同源数据测试中在特征空间内不同ID彼此可分无明显重合。同时在交叉数据集测试过程中二分类模型仍受到ID信息干扰来自相同ID的不同样本被投影到邻近区域。相反我们的方法在同源数据集和交叉数据集测试中不同身份的图片特征之间不可分且存在显著交集。这一结果说明所提出方法有效减少了模型对图片身份信息的提取。 4.2 不同主干网络精度对比实验为了验证算法的广泛适用性我们在不同的主干网络上进行了实验。实验表的结果表明在交叉数据集测试中我们的算法使用不同的主干网络都可以显著提升模型性能而在同源数据集测试中模型也可以保持模型精度。这一结果进一步说明了所提出方法的有效性即便是简单的二分类模型也可以取得不错的表现。同时根据可视化结果我们提出的算法准确检测到局部伪造特征区域具备更好的可解释性。 05 总结与展望在本文中我们发现以往利用二分类模型完成深伪检测的方式容易受到图片身份信息的影响从而限制了模型泛化能力的提升。本文提出了忽略身份特征的深伪检测方法迫使模型仅关注图片中包含伪造特征的局部区域并从不同区域中学习共性伪造特征以避免身份信息干扰。实验证明随着训练集中伪造方法增加提出的方法可以自主建模更鲁棒的共性伪造特征。综上本文为深伪检测算法泛化性研究提供了新的思路也为现实场景中的模型部署提供了一个更为简单有效的方案。 ——END—— 推荐阅读一文搞定专属码的设计与开发 AI原生应用速通指南代码理解技术应用实践介绍百度交易中台之内容分润结算系统架构浅析小程序编译器性能优化之路

查看全文

http://www.ho-use.cn/article/10822036.html