[DL] Deep Learning 학습 기본 개념(1)

📁 AI & Bigdata/AI & ML & DL

[DL] Deep Learning 학습 기본 개념(1)

SOIT 2022. 7. 27. 20:06

"Google 공인! 텐서플로(TensorFlow) 개발자 자격증 취득" 내용을 인용했습니다.

Google Colab 사용하기

: GPU 지원(딥러닝 실습 환경 지원)

1. Tool

텐서플로우(Tensorflow): 실무에서 많이 사용
파이토치(pytorch): Tensorflow의 하위 느낌-깊은 내용, numpy와 비슷
케라스(Keras): Google이 인수 후 사용 거의 안 하는 추세임

2. 딥러닝(Deep Learning) 학습

지도학습: input, label
비지도 학습:input
- input: X, fature, input데이터
- output: Y. label, output데이터

~~(본 강의에서는 지도학습만 진행할 예정임)~~

2.1 딥러닝 학습(실행) 순서

1. import: 필요한 모듈(라이브러리)를 import

2.전처리: 학습에 필요한 데이터 전처리를 수행합니다

3. 모델링(modeling): 모델을 정의한다.

4. 컴파일(complie): 모델을 생성한다.

5. 학습(fit): 모델을 학습시킨다 -optimizer, loss, ..

~~6.예측(predict): (구글이 채점해서 이 과정은 필요 없긴 하다)~~

2.2 선형 함수와 오차

나의 예측(모델): y= w * x + b
loss: Y예측값 - Y실제값

각 input의 오차를 구하는데, 전체 오차는 이 오차들의 합을 구해 계산한다.

loss: -2, 2, 4, 5, -4, -5
loss의 합: 0

그런데 오차를 그냥 다 합해버리면 0이 나올 수 있다. 0이 나오는 것은 오차가 없다는 뜻이니까 0이 나오면 안 된다.

따라서 그냥 loss의 합을 구하면 안 된다.

MAE(평균 절대값 오차)
MSE(평균 제곱 오차)

를 통해서 오차의 합을 구한다.

3. Basic 모델: Dense Layer(Fully Connected Layer)

완전하게 연결된 Dense layer는 (input, hidden, output) 3개의 layer로 구성됨

논문에서는 Fully Connected Layer라고 많이 부르지만, Tensorflow에서는 Dense layer라고 부름
hidden layer의 경우 black box와도 같음
newron(node)와 wight, bias로 구성됨

3.1 Dense Layer 구성

model = Sequential([
	Dense(3, input_shape=[1]),
        Dense(4),
        Dense(4),
        Dense(1),
)]

Dense layer(첫 번째 층:input layer)부터 쭉 내려오는 형태이다
input layer에서는 input _shape를 지정해 줘야하며, 이를 통해 output를 도출한다
Sequential()은 블록을 쌓듯이 layer을 순서대로 쌓아주는 것이다
- 마지막 " , "의 경우 안 해도 상관 없다

4. Dense Layer 실습

import numpy as np
import tensorflow as tf
from tensorflow.keras.layers import Dense
from tensorflow.keras.models import Sequential

xs = np.array([-1.0, 0.0, 1.0, 2.0, 3.0, 4.0], dtype=float)
ys = np.array([5.0, 6.0, 7.0, 8.0, 9.0, 10.0], dtype=float)

# 데이터의 복잡도가 단순할 때, Dense의 unit은 1로 지정
model = Sequential([
    Dense(1, input_shape=[1]),
])

4.1 input_shape

list형태나 tuple형태만가능하다.

input_shape = [1]
input_shape = (1, )
~~input_shape = (1)~~

하나씩 들어가기 때문에 1이다.

xs = np.array([-1.0, 0.0, 1.0, 2.0, 3.0, 4.0], dtype=float)
ys = np.array([5.0, 6.0, 7.0, 8.0, 9.0, 10.0], dtype=float)
- 만약에 4개씩 들어간다면 input_shape = [4] 가 된다.

4.2 컴파일(compile)

: 적절한 optimizer와 loss 선정하기

regression(회귀) 예측을 위해서는 loss=mse를 선택
optimizer는 'sgd'(Stochastic Gradient Descent)

model.compile(optimizer='sgd', loss='mse')

4.3 학습 (fit)

feature, label, epochs 지정

verbose= 0, epochs 표시 안 함
verbose=1, epochs 표시

model.fit(xs, ys, epochs=1200, verbose=0)

4.4 예측 (Predict)

Predict로 잘 학습이 되어있는지 검증

실제 시험에서는 학습까지만 하고 제출 예측은 검증하는데 도움이 많이 되는 것일 뿐

# output
# 16.000046
model.predict([10.0])

728x90

저작자표시 비영리 변경금지 (새창열림)