[컴퓨터비전] 9. 인식
9.1 도전
- •
인식은 컴퓨터 비전의 핵심 목표로, 사람처럼 물체를 구별하고 인식하는 기능을 의미함
- •
인식 기술의 성능을 평가하고 경쟁하기 위한 표준 데이터베이스와 국제 대회 존재
- •
대표적인 대회:
- ◦
PASCAL VOC: 20개 부류로 영상 분류 및 물체 탐지 등 다양한 문제 출제
- ◦
ImageNet ILSVRC: 대규모 이미지 분류 및 탐지 대회
- ◦
ICDAR RRC: 문자인식 관련 문제를 다룸
- •
인식 기술은 아직 어린아이보다 못한 수준이며, 지속적인 연구와 경쟁이 필요한 분야
9.2 사례 인식
- •
사례 인식(instance recognition): 특정 물체(예: 내 차, 내 고양이)를 인식하는 문제
- •
보통 기하 정렬 및 단어 가방(Bag of Words) 기법 사용
- •
기하 정렬:
- ◦
물체의 특징점 간의 대응 관계를 정렬하여 정확한 위치 파악
- •
단어 가방:
- ◦
영상에서 추출한 특징을 시각 단어로 양자화하고, 빈도수 기반으로 인식
- •
비교적 정해진 대상이므로 분류보다 매칭 방식으로 처리
9.3 범주 인식
- •
범주 인식(category recognition): ‘자동차’, ‘고양이’처럼 여러 사례가 포함된 부류를 인식
- •
부류 내 다양성(intra-class variation)이 크기 때문에 어려움이 큼
- •
세 가지 주요 방법:
- ◦
단어 가방(Bag of Words): 시각 단어의 빈도 기반 특징 벡터 생성. 외관 중심 방식
- ◦
부품 모델(Part-based Model): 물체의 부품 간 위치 관계 고려
- ◦
컨볼루션 신경망(CNN): 최근 대세. 대규모 데이터로 학습, 인식 정확도 높음
- •
지도 수준에 따라 강한 지도(strong supervision)와 약한 지도(weak supervision)로 나뉨
9.4 사람 인식
- •
사람 인식은 가장 활발히 연구되고 있는 주제
- •
다양한 응용 분야: 감시, 보안, 광고, 재활, 엔터테인먼트 등
- •
주요 인식 분야:
- ◦
생체 인식: 지문, 홍채, 손 모양 등
- ◦
얼굴 인식: 가장 많이 연구됨
- ◦
나이/성별/인종 인식: 얼굴 특징 및 걸음걸이 분석
- ◦
표정 인식: LBP 특징 + SVM 등으로 6가지 감정 구분
9.5 모바일 기기에 적용된 인식 기술
- •
스마트폰, 태블릿, 구글 글래스 등 모바일 장치에서 비전 기술의 활용이 증가
- •
다양한 센서(GPS, 자이로, 마이크 등)와 고성능 CPU/GPU 덕분에 실시간 인식 가능
- •
주요 응용 예:
- ◦
Face Unlock: 얼굴 인식으로 스마트폰 잠금 해제
- ◦
식물/상품 인식 앱: 카메라로 촬영 후 정보 제공
- •
모바일 비전 기술은 이동성과 센서 융합으로 새로운 응용 가능성 창출