[컴퓨터비전] 8. 기계 학습
8.1 기계학습의 기초
- •
기계 학습(Machine Learning): 경험(E)을 통해 주어진 작업(T)에 대한 성능(P)이 향상되면 학습이 이루어진 것으로 간주
→ 예: 분류 문제에서 학습 집합(E)을 통해 인식률(P)이 향상되면 학습이 일어난 것
- •
지도 학습 vs 비지도 학습
- ◦
지도 학습: 정답(라벨)이 주어진 데이터를 학습
- ◦
비지도 학습: 라벨 없이 데이터 간의 패턴을 학습
- •
재샘플링 기법: 학습 집합이 적을 때 성능 평가를 위해 사용하는 방법
- ◦
교차 검증과 붓스트랩 방식 등이 있음
8.2 신경망
- •
퍼셉트론: 가장 기초적인 신경망 구조. 입력층과 출력층으로 구성된 이진 분류기
- •
다층 퍼셉트론 (MLP): 여러 은닉층을 추가한 구조. 퍼셉트론의 한계를 극복
- •
활성 함수: 노드 출력을 비선형으로 변환하는 함수 (예: Sigmoid, ReLU)
- •
역전파 알고리즘 (Backpropagation): 오차를 출력에서 입력으로 역전달하며 가중치를 조정
- •
딥러닝(Deep Learning): 은닉층이 많은 신경망 구조. 영상 인식 등에서 강력한 성능 발휘
8.3 SVM (Support Vector Machine)
- •
기본 개념: 두 부류를 가장 잘 구분하는 결정 초평면을 찾는 분류기
- •
여백(Margin): 분류 경계와 가장 가까운 샘플 간의 거리. 이를 최대화하는 것이 목표
- •
선형 SVM: 선형 초평면으로 분류
- •
비선형 SVM: 커널 트릭(Kernel Trick)을 통해 비선형 분류 가능
- ◦
예: RBF 커널, 다항 커널 등
- •
다중 클래스 확장: 1대 M-1 방식이나 1대1 방식으로 다중 분류 구현
8.4 분류기 앙상블
- •
앙상블 기법: 여러 개의 분류기를 조합하여 더 나은 성능을 얻는 방법
- •
에이다부스트 (AdaBoost)
- ◦
약한 분류기를 반복 학습하며 가중치 조정
- ◦
오류가 큰 샘플에 더 집중
- •
임의 숲 (Random Forest)
- ◦
여러 개의 트리 분류기를 무작위로 학습하여 결합
- ◦
데이터와 특성의 선택에서 무작위성을 부여
- ◦
높은 정확도와 과적합 방지 효과
8.5 기계 학습을 이용한 얼굴 검출
- •
비올라-존스 얼굴 검출기: 대표적인 실시간 얼굴 검출 알고리즘
- ◦
Haar-like 특징과 아다부스트, 캐스케이드 구조를 조합
- ◦
빠른 검출 속도와 높은 정확도
- •
얼굴 검출 → 얼굴 인식의 전처리 단계
- •
기타 얼굴 검출 알고리즘들도 연구되고 있으며 성능 비교 논문도 존재