Meta开源Stable Signature数字水印技术,加固生成式AI防护墙

AI前沿2年前 (2023)更新 wanglu852
12,054 0 0
广告也精彩

2023年10月10日,中国的RPA行业迎来了一项重要的消息。全球社交媒体和科技巨头Meta(母公司包括Facebook和Instagram)宣布在其官方网站上开源了一款名为”Stable Signature”的数字水印产品,并公开了相关的论文。

据悉,Stable Signature是由Meta与法国国家信息与自动化研究所(INRIA)联合开发的。它可以直接嵌入到由人工智能生成的图片中,以防止这些图片被非法使用。

数字水印是增强生成式人工智能安全性的重要手段之一,微软、谷歌等科技巨头已经在他们的产品中广泛采用了这一技术。

Stable Signature生成的数字水印具有很强的扩展性,即使在裁剪、压缩或改变颜色等破坏性操作后仍然能够有效追溯到图片的初始来源。这种技术可以应用于扩散模型和生成对抗网络等不同类型的模型,其中包括著名的文生图开源项目Stable Diffusion。

Stable Signature的技术原理并不复杂。开发人员通过对一个主生成模型Alice进行训练和微调,确定了Bob需要嵌入的水印,以便对AI生成的图片进行识别,识别图片的版本、公司、用户和其他特征。

Bob使用不同的扩散模型版本来生成带有水印的图片,并且这些水印可以由Alice或其他AI进行分析,以验证图片是否由AI生成。

为了实现这一目标,开发人员采取了以下两个步骤:
1)训练两个卷积神经网络,一个用于将图像和随机消息编码成水印图像,另一个用于从增强版本的水印图像中提取消息。训练完成后,只保留水印提取器。
2)微调生成模型的潜在解码器,以生成带有固定签名的图像。在这个微调过程中,通过对批量图像进行编码、解码和优化,最大限度地减少提取的消息与目标消息之间的差异,并保持感知图像质量。
这个优化过程非常高效,只需要少量的时间和计算资源,就能获得高质量的结果。

在性能评估中,开发人员发现Stable Signature具有出色的抗破坏性和主动检测能力。它不受裁剪、压缩、改变颜色等破坏性操作的影响,并且具备控制和减少误报的能力。

误报是指将人类制作的图片错误地识别为由AI生成的图片。有关方面已经注意到,现有的检测方法可以找出大约50%的编辑过的生成图片,但误报率仍然高达1/100。

这意味着在一个每天接收到10亿张图片的用户生成内容平台上,为了只检测到一半的生成图片,误标记的图片数量可能达到1000万张。

然而,Stable Signature可以达到10-10的误报率(或者可以根据需求设置期望值),从而提供了高度准确的图片检测能力。

此外,Stable Signature的水印方法允许用户追踪同一模型的不同版本的图片,这对于识别AI生成的图片非常重要。

Meta表示,由于Midjourney、Stable Diffusion等文本生成图片的生成式人工智能产品在各个领域被广泛应用,但同时也面临着非法使用的问题,例如通过Midjourney生成合成的名人照片,并用于制造谣言事件。

通过将数字水印嵌入到AI生成的图片中,Stable Signature可以极大地减少这类事件的发生,提高了生成式人工智能的安全性。

© 版权声明
chatgpt4.0

相关文章

error: Content is protected !!