[컴퓨터비전] 11. 3차원 비전
11.1 본질 영상
- •
본질 영상은 명암값에서 조명, 그림자 등의 외부 요인을 제거하고 물체의 고유한 성질만을 표현한 영상
- •
사람은 외관과 본질을 구별할 수 있지만 컴퓨터는 일반적으로 외관만을 인식
- •
본질 영상의 주요 예:
- ◦
깊이 영상: 카메라로부터의 거리
- ◦
반사율 영상: 표면의 고유 반사율
- ◦
법선 벡터 영상: 표면의 방향
- ◦
조명 영상: 광원의 위치 및 강도
- •
Barrow(1978)가 본질 영상의 개념을 제안했지만, 명암 영상에서 본질 영상을 복원하는 방법은 아직 미해결
- •
반사율과 조명의 곱으로 명암값을 설명하는 단순 모델이 사용됨:
- •
Finlayson은 조명 변화에 따라 그림자 제거 기법을 제안했고 그림자를 제거한 RGB 영상 복원이 가능함
11.2 스테레오
- •
스테레오 비전: 두 대의 카메라를 이용하여 깊이 정보를 추정
- •
사람의 양안 시차 원리를 모방함
- •
핵심 단계: 대응점 찾기
- •
대응점을 알면 간단한 삼각 측량 수식으로 깊이를 구할 수 있음
예:
- ◦
f: 초점 거리
- ◦
b: 카메라 간 거리(기선)
- ◦
d: 시차(disparity)
- •
문제점:
- ◦
매칭 오류 발생 가능
- ◦
물체 경계나 질감이 없는 부분에서는 어려움
- •
개선된 알고리즘:
- ◦
순진한 스테레오 알고리즘: 대응점만 찾아 깊이 계산
- ◦
적응형 가중치(Adaptive Weights) 사용 SSD 개선법
- ◦
지역 방법과 전역 방법으로 구분됨
11.3 능동센서
- •
능동 센서: 장면에 무언가를 투사한 후, 반사된 정보를 분석해 깊이 측정
- •
대표 기법:
- ◦
구조광:
- ▪
미리 설계된 패턴(무늬)을 투사하고 왜곡 분석
- ▪
예: Kinect 1세대
- ◦
비행 시간(Time of Flight, ToF):
- ▪
적외선 레이저를 쏘고 반사 시간(또는 위상차)을 측정
- ▪
예: SwissRanger, CamCube
- •
장점: 조도 변화나 텍스처 부족에도 강건함
- •
응용: 사람 자세 추정, 3D 게임 인터페이스 등
11.4 깊이 영상의 인식
- •
깊이 영상: 각 화소의 깊이값(거리)만을 표현한 영상
- •
컬러 영상 vs 깊이 영상:
- ◦
사람은 컬러 영상을 더 잘 이해
- ◦
컴퓨터는 깊이 영상에서 더 안정적으로 정보 추출
- •
깊이 영상의 활용:
- ◦
배경 분리: 연속 영상에서 차 영상 기법 사용
- ◦
사람 자세 추정: 관절 위치를 추정하여 스켈레톤 구성
- •
Kinect:
- ◦
RGB 영상 + 깊이 영상 동시 제공
- ◦
30fps로 640x480 해상도 깊이 영상 제공
- ◦
그림자나 조명 영향 없이 안정적인 인식 가능