본문 바로가기

Deep learning

딥러닝 소개

www.youtube.com/watch?v=CS4cs9xVecg

학습 목표

- Deep learning을 포함해 새로운 Neural Network를 설계하는 방법, 데이터를 가지고 학습하는 방법을 배워 고양이 인식기 만들기

- NN 작동원리 및 하이퍼 파라미터 조율, bias variance를 찾는 방법, 최적화 알고리즘

- ML 프로젝트 설계 방법

- 이미지에 적용되는 CNN 모델 구축 방법

 

 

 

 

l  Deep learning

-      사물이나 데이터를 군집화하거나 분류하는 데 사용하는 기술

-      다층구조 형태의 신경망을 기반으로 하는 머신 러닝의 한 분야

 

l  Neural Network

-      신경망란 입력(x)와 출력(y)를 매칭해주는 함수를 찾는 과정

-      충분한 데이터가 주어지면 더 잘 알아낼 수 있음

-      해당 뉴런에 관계없는 입력값이라도 입력으로 넣어주어야 함

-      관계 여부는 신경망이 학습하면서 알아서 조절함

 

l  CNN (Convolution Neural Network)

-      데이터의 특징을 추출하여 특징들의 패턴을 파악하는 구조

-      Convolution Layer Pooling Layer를 복합적으로 구성된 알고리즘

-      이미지 분류, 정보 추출, 얼굴 인식 등에 사용

 

l  RNN (Recorrect Neural Network)

-      반복적이고 순차적인 데이터(Sequential data)학습에 특화된 인공신경망의 한 종류

-      순환구조를 이용하여 과거의 학습을 Weight를 통해 현재 학습에 반영

-      현재의 학습과 과거의 학습을 연결 가능, 시간에 종속됨

-      음성을 텍스트로 변환시킬 때 사용

 

l  지도 학습(Supervised Learning)

-      정답이 주어져 있는 데이터를 사용하여 컴퓨터를 학습시키는 방법

-      입력 x와 목표치 d로 이루어진 (x, d) 학습 패턴 쌍이 필요함

 

l  구조적 데이터(Structured Data)

-      데이터베이스로 표시된 데이터

-      정보의 특성이 잘 정의되어 있음

 

l  비구조적 데이터(Unstructured Data)

-      이미지, 오디오 같이 특정적인 값을 추출하기 어려운 형태의 데이터

-      딥러닝을 통해 인식 가능함

 

최근 딥러닝의 성능이 향상된 이유

-      데이터 양 증가

-      컴퓨터 성능 향상

-      알고리즘의 개선

 

 

l  Sigmoid 함수

-      입력된 데이터를 0 1 사이의 값으로 출력하는 비선형 함수로 미분가능한 연속성을 가진 함수

-      인공신경망의 활성화 함수로 사용됨

-      양 끝의 미분값이 0이 되어 Gradient가 소멸됨

 

l  ReLU 함수

-      입력값이 0보다 작으면 0으로 출력, 0보다 크면 그대로 출력

-      Sigmoid 함수에서 Gradient가 소멸되는 문제 해결 가능