对抗样本#
[Szegedy et al., 2014] 发现对数据添加一些微小的扰动就可以改变模型的分类结果,甚至还可以通过添加扰动让模型对不同的数据产生相同的分类结果。他们将这种人眼看来没有区别,但是模型却分错了样本称为对抗样本。
寻找对抗样本的过程被他们定义为优化问题:
对数据
生成的扰动
不过,他们实际求解的是下面这个优化问题:
其中
这个形式非常有意思,因为如果把优化的对象换成
[Szegedy et al., 2014] 发现对数据添加一些微小的扰动就可以改变模型的分类结果,甚至还可以通过添加扰动让模型对不同的数据产生相同的分类结果。他们将这种人眼看来没有区别,但是模型却分错了样本称为对抗样本。
寻找对抗样本的过程被他们定义为优化问题:
对数据
生成的扰动
不过,他们实际求解的是下面这个优化问题:
其中
这个形式非常有意思,因为如果把优化的对象换成