ML对抗攻击

佚名 6年前 (2020-01-17) 随笔 1642人围观抢沙发百度已收录

记录一下李宏毅机器学习课程关于对抗攻击的内容；

1、

SRE实战互联网时代守护先锋，助力企业售后服务体系运筹帷幄！一键直达领取阿里云限量特价优惠。

一般模型training过程：

　　输入x_0，调整模型Network的参数θ，使得输出y_0和y_true的loss越小越好；损失函数：L_train(θ) = C(y_0, y_true)

Non-targeted Attack：

　　固定模型Network的参数θ，调整输入x'，使得输出y'和y_true越远越好；损失函数：L(x') = -C(y', y_true)

Targeted Attack:

　　固定模型Network的参数θ，调整输入x'，使得输出y'和y_true越远越好，同时让y'和某个y_false越近越好; L(x') = -C(y', y_true) + C(y',y_false)

Constraint:

　　约束：d(x_0,x') ≤ ε,希望攻击后的图片不要被人所发现，x_0和x'够相近

　　常见的有两种约束，L2-norm和L-infinity

　　1）L2-norm

　　　　d(x_0, x') = ||x_0 - x'||₂

　　　　 = (Δx_1)²+ (Δx_2)²+ (Δx_3)²+...

　　2) L-infinity　　

　　　　d(x_0, x') = ||x_0 - x'||_∞

　　　　 =max{ Δx_1, Δx_2+ Δx_3+...}

How to attack

　　x^* = min L(x') st d(x_0, x') ≤ ε

用Gradient Descent

for t = 1 to T

x_t <— x_t-1 - η求导(x_t-1)

if d(x_0, x_t) > ε #满足L2-norm或者L-infinity

大部分attack只是用不同的距离来作为约束，以及用不同的优化方法来最小化这个距离

Defense

　　Passive defense：Finding the attached image without modifying the model

　　Proactive defense: Training a model that is robust to adversarial attack

扫码关注我们

微信号：SRE实战

拒绝背锅运筹帷幄

赞 0 赏分享

转载请注明 : 文章转载自小翔博客 ML对抗攻击

本文标题：ML对抗攻击

本文链接：https://www.liuyixiang.com/post/101810.html

上一篇 : n阶高精度乘法，（求高阶阶乘）

下一篇 : Java网络编程之UDP网络编程

评论列表暂无评论

发表评论

一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29

ML对抗攻击

选择打赏方式：

选择分享方式：

Petter

101481

12

121484300

ML对抗攻击

选择打赏方式：

选择分享方式：

Petter

101481

12

121484300

User Login

帐号或密码错误,请重试.