www.youtube.com/watch?v=CS4cs9xVecg
학습 목표
- Deep learning을 포함해 새로운 Neural Network를 설계하는 방법, 데이터를 가지고 학습하는 방법을 배워 고양이 인식기 만들기
- NN 작동원리 및 하이퍼 파라미터 조율, bias와 variance를 찾는 방법, 최적화 알고리즘
- ML 프로젝트 설계 방법
- 이미지에 적용되는 CNN 모델 구축 방법
l Deep learning
- 사물이나 데이터를 군집화하거나 분류하는 데 사용하는 기술
- 다층구조 형태의 신경망을 기반으로 하는 머신 러닝의 한 분야
l Neural Network
- 신경망란 입력(x)와 출력(y)를 매칭해주는 함수를 찾는 과정
- 충분한 데이터가 주어지면 더 잘 알아낼 수 있음
- 해당 뉴런에 관계없는 입력값이라도 입력으로 넣어주어야 함
- 관계 여부는 신경망이 학습하면서 알아서 조절함
l CNN (Convolution Neural Network)
- 데이터의 특징을 추출하여 특징들의 패턴을 파악하는 구조
- Convolution Layer와 Pooling Layer를 복합적으로 구성된 알고리즘
- 이미지 분류, 정보 추출, 얼굴 인식 등에 사용
l RNN (Recorrect Neural Network)
- 반복적이고 순차적인 데이터(Sequential data)학습에 특화된 인공신경망의 한 종류
- 순환구조를 이용하여 과거의 학습을 Weight를 통해 현재 학습에 반영
- 현재의 학습과 과거의 학습을 연결 가능, 시간에 종속됨
- 음성을 텍스트로 변환시킬 때 사용
l 지도 학습(Supervised Learning)
- 정답이 주어져 있는 데이터를 사용하여 컴퓨터를 학습시키는 방법
- 입력 x와 목표치 d로 이루어진 (x, d) 학습 패턴 쌍이 필요함
l 구조적 데이터(Structured Data)
- 데이터베이스로 표시된 데이터
- 정보의 특성이 잘 정의되어 있음
l 비구조적 데이터(Unstructured Data)
- 이미지, 오디오 같이 특정적인 값을 추출하기 어려운 형태의 데이터
- 딥러닝을 통해 인식 가능함
최근 딥러닝의 성능이 향상된 이유
- 데이터 양 증가
- 컴퓨터 성능 향상
- 알고리즘의 개선
l Sigmoid 함수
- 입력된 데이터를 0과 1 사이의 값으로 출력하는 비선형 함수로 미분가능한 연속성을 가진 함수
- 인공신경망의 활성화 함수로 사용됨
- 양 끝의 미분값이 0이 되어 Gradient가 소멸됨
l ReLU 함수
- 입력값이 0보다 작으면 0으로 출력, 0보다 크면 그대로 출력
- Sigmoid 함수에서 Gradient가 소멸되는 문제 해결 가능