[컴퓨터비전] 9. 인식

2025-06-08
#컴퓨터비전
1

9.1 도전

  • 인식은 컴퓨터 비전의 핵심 목표로, 사람처럼 물체를 구별하고 인식하는 기능을 의미함

  • 인식 기술의 성능을 평가하고 경쟁하기 위한 표준 데이터베이스국제 대회 존재

  • 대표적인 대회:

    • PASCAL VOC: 20개 부류로 영상 분류 및 물체 탐지 등 다양한 문제 출제

    • ImageNet ILSVRC: 대규모 이미지 분류 및 탐지 대회

    • ICDAR RRC: 문자인식 관련 문제를 다룸

  • 인식 기술은 아직 어린아이보다 못한 수준이며, 지속적인 연구와 경쟁이 필요한 분야


9.2 사례 인식

  • 사례 인식(instance recognition): 특정 물체(예: 내 차, 내 고양이)를 인식하는 문제

  • 보통 기하 정렬단어 가방(Bag of Words) 기법 사용

  • 기하 정렬:

    • 물체의 특징점 간의 대응 관계를 정렬하여 정확한 위치 파악

  • 단어 가방:

    • 영상에서 추출한 특징을 시각 단어로 양자화하고, 빈도수 기반으로 인식

  • 비교적 정해진 대상이므로 분류보다 매칭 방식으로 처리


9.3 범주 인식

  • 범주 인식(category recognition): ‘자동차’, ‘고양이’처럼 여러 사례가 포함된 부류를 인식

  • 부류 내 다양성(intra-class variation)이 크기 때문에 어려움이 큼

  • 세 가지 주요 방법:

    • 단어 가방(Bag of Words): 시각 단어의 빈도 기반 특징 벡터 생성. 외관 중심 방식

    • 부품 모델(Part-based Model): 물체의 부품 간 위치 관계 고려

    • 컨볼루션 신경망(CNN): 최근 대세. 대규모 데이터로 학습, 인식 정확도 높음

  • 지도 수준에 따라 강한 지도(strong supervision)와 약한 지도(weak supervision)로 나뉨


9.4 사람 인식

  • 사람 인식은 가장 활발히 연구되고 있는 주제

  • 다양한 응용 분야: 감시, 보안, 광고, 재활, 엔터테인먼트 등

  • 주요 인식 분야:

    • 생체 인식: 지문, 홍채, 손 모양 등

    • 얼굴 인식: 가장 많이 연구됨

    • 나이/성별/인종 인식: 얼굴 특징 및 걸음걸이 분석

    • 표정 인식: LBP 특징 + SVM 등으로 6가지 감정 구분


9.5 모바일 기기에 적용된 인식 기술

  • 스마트폰, 태블릿, 구글 글래스 등 모바일 장치에서 비전 기술의 활용이 증가

  • 다양한 센서(GPS, 자이로, 마이크 등)와 고성능 CPU/GPU 덕분에 실시간 인식 가능

  • 주요 응용 예:

    • Face Unlock: 얼굴 인식으로 스마트폰 잠금 해제

    • 식물/상품 인식 앱: 카메라로 촬영 후 정보 제공

  • 모바일 비전 기술은 이동성과 센서 융합으로 새로운 응용 가능성 창출