0

如果你们中的任何人都不知道,敌对图像是属于某个类别的图像,但随后被扭曲而对人眼没有任何视觉感知差异,但是网络误解了它在一个完全不同的类。约在这里机器学习(敌对图像)

的更多信息: http://karpathy.github.io/2015/03/30/breaking-convnets/

使用TensorFlow,我学到了很多关于卷积神经网络。

def weight_variable(shape): 
    initial = tf.truncated_normal(shape, stddev=0.1) 
    return tf.Variable(initial) 

def bias_variable(shape): 
    initial = tf.constant(0.1, shape=shape) 
    return tf.Variable(initial) 

def conv2d(x, W): 
    return tf.nn.conv2d(x, W, strides=[1, 1, 1, 1], padding='SAME') 

def max_pool_2x2(x): 
    return tf.nn.max_pool(x, ksize=[1, 2, 2, 1], 
         strides=[1, 2, 2, 1], padding='SAME') 

W_conv1 = weight_variable([5, 5, 1, 32]) 
b_conv1 = bias_variable([32]) 

x_image = tf.reshape(x, [-1,28,28,1]) 

h_conv1 = tf.nn.relu(conv2d(x_image, W_conv1) + b_conv1) 
h_pool1 = max_pool_2x2(h_conv1) 


W_conv2 = weight_variable([5, 5, 32, 64]) 
b_conv2 = bias_variable([64]) 

h_conv2 = tf.nn.relu(conv2d(h_pool1, W_conv2) + b_conv2) 
h_pool2 = max_pool_2x2(h_conv2) 


W_fc1 = weight_variable([7 * 7 * 64, 1024]) 
b_fc1 = bias_variable([1024]) 

h_pool2_flat = tf.reshape(h_pool2, [-1, 7*7*64]) 
h_fc1 = tf.nn.relu(tf.matmul(h_pool2_flat, W_fc1) + b_fc1) 

keep_prob = tf.placeholder(tf.float32) 
h_fc1_drop = tf.nn.dropout(h_fc1, keep_prob) 


W_fc2 = weight_variable([1024, 10]) 
b_fc2 = bias_variable([10]) 

y_conv = tf.matmul(h_fc1_drop, W_fc2) + b_fc2 

的挑战是要输入的数字2也被标记为“2”的图像,并以某种方式进行卷积这个图像,从而输出将其识别为“6”,改变像素,从而略微该差是无法辨认的。

任何人都知道从哪里开始呢?

+0

您应该首先阅读提及如何生成敌对示例的论文。 –

回答

1

可以通过阅读本文开始:https://arxiv.org/abs/1412.6572(例如)

它解释的通过计算损失函数的梯度相对于输入以生成对抗性实例的方式之一。

看一看tf.gradients()

一旦你定义了你的损失函数,这是例如交叉熵,你这样做:

grads = tf.gradients(loss, [x])[0] 
signs = tf.sign(grads) 
epsilon = tf.constant(0.25) 
x_adversarial = tf.add(tf.multiply(epsilon, signs), x) 

x_adversarial将是你偷偷摸摸的图像。你可以玩epsilon值,它可以设置附加噪音的大小。