[컴퓨터비전] 11. 3차원 비전

2025-06-10
#컴퓨터비전
1

11.1 본질 영상

  • 본질 영상은 명암값에서 조명, 그림자 등의 외부 요인을 제거하고 물체의 고유한 성질만을 표현한 영상

  • 사람은 외관과 본질을 구별할 수 있지만 컴퓨터는 일반적으로 외관만을 인식

  • 본질 영상의 주요 예:

    • 깊이 영상: 카메라로부터의 거리

    • 반사율 영상: 표면의 고유 반사율

    • 법선 벡터 영상: 표면의 방향

    • 조명 영상: 광원의 위치 및 강도

  • Barrow(1978)가 본질 영상의 개념을 제안했지만, 명암 영상에서 본질 영상을 복원하는 방법은 아직 미해결

  • 반사율과 조명의 곱으로 명암값을 설명하는 단순 모델이 사용됨: (x,y)=s(x,y)r(x,y)(x, y) = s(x, y) \cdot r(x, y)

  • Finlayson은 조명 변화에 따라 그림자 제거 기법을 제안했고 그림자를 제거한 RGB 영상 복원이 가능함


11.2 스테레오

  • 스테레오 비전: 두 대의 카메라를 이용하여 깊이 정보를 추정

  • 사람의 양안 시차 원리를 모방함

  • 핵심 단계: 대응점 찾기

  • 대응점을 알면 간단한 삼각 측량 수식으로 깊이를 구할 수 있음

    예: Z=fbdZ = \frac{f \cdot b}{d}

    • f: 초점 거리

    • b: 카메라 간 거리(기선)

    • d: 시차(disparity)

  • 문제점:

    • 매칭 오류 발생 가능

    • 물체 경계나 질감이 없는 부분에서는 어려움

  • 개선된 알고리즘:

    • 순진한 스테레오 알고리즘: 대응점만 찾아 깊이 계산

    • 적응형 가중치(Adaptive Weights) 사용 SSD 개선법

    • 지역 방법전역 방법으로 구분됨


11.3 능동센서

  • 능동 센서: 장면에 무언가를 투사한 후, 반사된 정보를 분석해 깊이 측정

  • 대표 기법:

    • 구조광:

      • 미리 설계된 패턴(무늬)을 투사하고 왜곡 분석

      • 예: Kinect 1세대

    • 비행 시간(Time of Flight, ToF):

      • 적외선 레이저를 쏘고 반사 시간(또는 위상차)을 측정

      • 예: SwissRanger, CamCube

  • 장점: 조도 변화나 텍스처 부족에도 강건함

  • 응용: 사람 자세 추정, 3D 게임 인터페이스 등


11.4 깊이 영상의 인식

  • 깊이 영상: 각 화소의 깊이값(거리)만을 표현한 영상

  • 컬러 영상 vs 깊이 영상:

    • 사람은 컬러 영상을 더 잘 이해

    • 컴퓨터는 깊이 영상에서 더 안정적으로 정보 추출

  • 깊이 영상의 활용:

    • 배경 분리: 연속 영상에서 차 영상 기법 사용

    • 사람 자세 추정: 관절 위치를 추정하여 스켈레톤 구성

  • Kinect:

    • RGB 영상 + 깊이 영상 동시 제공

    • 30fps로 640x480 해상도 깊이 영상 제공

    • 그림자나 조명 영향 없이 안정적인 인식 가능