[인공지능] 합성곱 신경망

728x90

완전연결 (fully connected) : 신경망에 인접하는 계층의 모든 뉴련과 결합되어 있음

Affine 계층 : 완전히 연결된 계층
단점 : 데이터의 형상이 무시됨 : 이미지는 가로 x 세로 x 채널 색상 로 구성된 3 차원 데이터인데 완전연결 계층에 입력할 때는 3 차원 데이터를 평평한 1 차원 데이터로 평탄화해줘야 함

합성곱 신경망(CNN) : 합성곱 계층 (convolution layer)과 풀링 계층 (pooling layer)가 추가

합성곱 연산 : 필터의 윈도우 ( 를 일정 간격으로 이동해가며 입력 데이터에 적용하고 , 입력과 필터에서 대응하는 원소끼리 곱한 후 그 총합을 구함, 영상처리의 필터 (filter, 커널 kernel) 연산과 동일함

합성곱 연산의 편향 (bias)

패딩 (padding) : 합성곱 연산을 수행하기 전 입력 데이터 주변을 특정 값으로 채움으로써 출력 크기를 조정할 목적으로 사용함

스트라이드 (stride) : 필터를 적용하는 위치의 간격으로 스트라이드를 키우면 출력크기는 작아짐, 패딩을 크게 하면 출력 크기가 커짐

3 차원 데이터의 합성곱 연산

블록으로 생각하기

3 차원 데이터를 다차원 배열로 나타낼 때는 채널 channel , 높이 height 너비 width ) 순서로 사용하며 , 필터도 같은 순서를 사용함

필터를 고려한 4 차원 데이터를 다차원 배열로 나타낼 때는 출력 채널 output channel , 입력채널 input channel , 높이 height , 너비 width ) 순서로 사용하며 , 필터도 같은 순서를 사용함

풀링 계층 (Pooling Layer) : 세로 , 가로 방향의 공간을 줄이는 연산

층 깊이에 따른 추출 정보 변화
1 번째 층의 합성곱 계층 : Edge 등의 저수준 정보 추출
3 번째 층의 합성곱 계층 : 텍스처 정보 추출
5 번째 층의 합성곱 계층 : 사물의 일부

대표적인 CNN

LeNet : 손글씨 숫자 인식하는 네트워크, 합성곱 계층과 풀링 계층을 반복하고 마지막으로 완전연결 계층을 거치면
서 결과를 출력함

AlexNet : 2012 년 ILSVRC (ImageNet Large Scale Visual Recognition Challenge) 에서 Top5 test error 기준 15.4% 를 기록해 1 위를 차지

728x90

'미쳤습니까 휴먼 (AI)' 관련글