read

MNIST


MNIST

MNIST는 너무 유명한 예시다.

데이터 셋부터 보도록 하자.

28x28 픽셀의 데이터고, 모든 한자리가 하나의 input이 되므로, 784개가 input이 된다.

그리고 출력은 0~9까지 10개가 된다. 즉, 10개중에 한개만 정답이므로 보통 one-hot 인코딩이 사용된다.

X = tf.placeholder(tf.float32, [None, 784])
Y = tf.placeholder(tf.float32, [None, nb_classes])

MNIST는 너무 유명해서 tensorflow가 example로 제공해준다.

from tensorflow.examples.tutorials.mnist import input_data
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

one_hot으로 읽어온다는 것을 볼 수 있고, training_epochs = 15 batch_size = 100 batch_xs, batch_ys = mnist.train.next_batch(batch_size)

위 코드로 한번에 몇개씩 학습시킬지 정하는 batch_size에 따라 끊어서 학습시킨다는 걸 볼 수 있고, epoch라는 게 나오는데, 전체 데이터 셋을 다 학습 시키는 것을 1epoch 라고 한다.

데이터가 매우 많을 때, batch_size로 잘라서 사용하는데, 만약 전체 데이터가 1000개면 이를 500 batch_size로 잘라서 할 때, 1번의 epoch에 2번을 돌게 된다.

따라서, 다음과 같다.

  for epoch in range(training_epochs):
    avg_cost = 0
    total_batch = int(mnist.train.num_examples / batch_size)

    for i in range(total_batch):
        batch_xs, batch_ys = mnist.train.next_batch(batch_size)
        c, _ = sess.run([cost, optimizer], feed_dict={
                        X: batch_xs, Y: batch_ys})
        avg_cost += c / total_batch

total_batch는 iteration이다.

전체 사이즈가 10000개라면 100번 iteration을 하면 1 epoch가 되는 것이다.

그리고 지금껏 실행할 때, sses.run을 사용했는데, print(“Accuracy: “, accuracy.eval(session=sess, feed_dict={ X: mnist.test.images, Y: mnist.test.labels}))

위와 같이 accuracy.eval 처럼 계산도 가능하다.

전체 코드를 보면, 다음과 같다.

import tensorflow as tf
import random
# import matplotlib.pyplot as plt
tf.set_random_seed(777)  # for reproducibility

from tensorflow.examples.tutorials.mnist import input_data
# Check out https://www.tensorflow.org/get_started/mnist/beginners for
# more information about the mnist dataset
mnist = input_data.read_data_sets("MNIST_data/", one_hot=True)

nb_classes = 10

# MNIST data image of shape 28 * 28 = 784
X = tf.placeholder(tf.float32, [None, 784])
# 0 - 9 digits recognition = 10 classes
Y = tf.placeholder(tf.float32, [None, nb_classes])

W = tf.Variable(tf.random_normal([784, nb_classes]))
b = tf.Variable(tf.random_normal([nb_classes]))

# Hypothesis (using softmax)
hypothesis = tf.nn.softmax(tf.matmul(X, W) + b)

cost = tf.reduce_mean(-tf.reduce_sum(Y * tf.log(hypothesis), axis=1))
optimizer = tf.train.GradientDescentOptimizer(learning_rate=0.1).minimize(cost)

# Test model
is_correct = tf.equal(tf.arg_max(hypothesis, 1), tf.arg_max(Y, 1))
# Calculate accuracy
accuracy = tf.reduce_mean(tf.cast(is_correct, tf.float32))

# parameters
training_epochs = 15
batch_size = 100

with tf.Session() as sess:
    # Initialize TensorFlow variables
    sess.run(tf.global_variables_initializer())
    # Training cycle
    for epoch in range(training_epochs):
        avg_cost = 0
        total_batch = int(mnist.train.num_examples / batch_size)

        for i in range(total_batch):
            batch_xs, batch_ys = mnist.train.next_batch(batch_size)
            c, _ = sess.run([cost, optimizer], feed_dict={
                            X: batch_xs, Y: batch_ys})
            avg_cost += c / total_batch

        print('Epoch:', '%04d' % (epoch + 1),
              'cost =', '{:.9f}'.format(avg_cost))

    print("Learning finished")

    # Test the model using test sets
    print("Accuracy: ", accuracy.eval(session=sess, feed_dict={
          X: mnist.test.images, Y: mnist.test.labels}))

    # Get one and predict
    r = random.randint(0, mnist.test.num_examples - 1)
    print("Label: ", sess.run(tf.argmax(mnist.test.labels[r:r + 1], 1)))
    print("Prediction: ", sess.run(
        tf.argmax(hypothesis, 1), feed_dict={X: mnist.test.images[r:r + 1]}))

기본으로 돌아가볼 껀데, 이는 https://github.com/hunkim/DeepLearningZeroToAll/blob/master/lab-08-tensor_manipulation.ipynb

여기서 꼭 확인하고 잘 알아두자.

이후에 다시 진행하자.

Blog Logo

구찌


Published

Image

구찌의 나도한번 해블로그

구찌의 개발 블로그 입니다.

Back to Overview