노력과 삽질 퇴적물

<02>영상처리 기초 본문

프로그래밍note/멀티미디어

<02>영상처리 기초

알 수 없는 사용자 2011. 4. 10. 11:48
1. 사람눈의 특징
⑴눈의 구조: '보기'라는 동작에서 눈이 수행하는 행동은 아래의 2가지
To recognize details of a scene (the spatial resolution of the scene)
To recognize changes in a scene (the temporal resolution of a scene)
-> ㅁㅁ을 본다 = 원래장면의 요소요소 - 지금 장면의 요소요소 = 요소의 변화

⑵망막: 수정체를 통해 들어온 빛이 망막에서 상이 맺힘.
 ①원추체(cone) 시세포: 색채판별. 약 120*10^6개
-> RGB값에서 G>R>B순으로 예민하게 감지할수 있다.
②간상체(rod) 시세포: 명암판별.   약    8*10^6개
-> 세포의 분포상, 색상보다는 빛의 감광을 더 예민하게 감지.

⑶수정체: 카메라로 치면, 렌즈격

⑷홍채: 카메라의 조리개 역할을 하는 근육조직
-> 홍채의 수직이완으로 동공의 크기가 변한다.



2. 영상기초 이론
* 압축관련
-> 부표본화 = 압축이 더 많이 된다.
-> 중복성제거 = 손실압축, 사람의 눈에 인지 되지 않을정도로만 원본에서 잘라냄.

⑴컬러모델: RGB(Red, Green, Blue) 모델, YCbCr 모델, HSI(Hue, Saturation, Intensity) 모델
* 색상좌펴계는 사람이 인지하는 색상을 좌표계를 적용해서 표기한것
①RGB(Red, Green, Blue) 모델: 컴퓨터그래픽스등 컴퓨터작업에 적합
-> (3 * 8bit) * 2 = 64비트
-> 16,777,216색상 표현가능.(TV에는 부적합)

-> 흑백화 공식: Gray value = 0.3R+0.6G+0.1B, or (R+G+B)/3
-> 최상의 압축을 위해서는 각 색의 요소들이 분리되어야 한다.
-> 참고: RGB에서 다른 컬러모델 변환공식
②YCbCr 모델: TV쪽 색상모델로 적합

-> Y: 화소의 밝기값
-> Cb: 푸른 정도(코발트)
-> Cr: 붉은 정도(크레온)
③HSI(Hue, Saturation, Intensity) 모델: 영상처리 응용에 유용.


-> 색상(Hue): 최근에는 color로 주장되기도?
-> 채도(Saturation): 0~100% (무채색~채색)
-> 명도(intensity OR brigh): 명암의 그것.

⑵디지털 영상처리
①디지털영상처리의 시초 -> 1994년 달표면 위성사진 화질개선.
②디지털영상처리
-> 디카
-> 의료영상은 표면에 한해서, 일정한 버텍스값들이 존재하는게 아니라, 물체의 내부까지 찍는 형태라서.
③픽셀
-> 화면에 표현되는 가장 작은 사각형 단위.
④Voxel
-> 화면등에 표현되는 최소크기의 정사각형 단위.

디지털 영상처리 컴퓨터 그래픽스
-> 실제의 영상을 조작
-> 2차원 데이터로 제한되나, 의학 진단 분야의 경우 3차원 데이터도 수행(MRI의 연속 단면 영상, OCR등)
-> 컴퓨터 프로그램에 의한 합성영상을 생성
-> 2차원과 3차원 물체를 가지고 작업


⑶영상획득
①프레임 크래버
-> 아날로그 카메라를 PC에 디지털로 변환해서 저장할수 있게 한다.
-> ADC (아날로그->디지털 컨버터)
②PC카메라( 예: 웹캠)
-> 예전에는 640*480*3으로 USB 1.1일적이나, 요즘은 USB2.0이나 USB3.0으로

⑷공간해상도

①해상도를 낮출수록 얼라이싱(alising)이 심해진다.
②샘플링 레이트(여기서는 해상도)가 줄어들수록 사진내에서 인지할수 있는 정보가 줄어듬.
③사진에서의 고주파 = 세밀묘사
④사람의 눈은 저주파에 먼저 반응 = 물체의 덩어리, 형태
⑤1화소 == 1픽셀(용량, 1바이트)
-> 640*480이면, 300KB로 보면 무난

 ⑸밝기해상도: 1픽셀당, 얼마만큼의 색상값인가

⑹기타
① CCD(Charge-Couple Device)
-> 대부분의 카메라, 캠코더 및 스캐너의 핵심부품이다.
-> 아날로그 영상신호를 디지털 신호로 변환해 주는 이러한 디지타이저(스캐너, 디지털 카메라 등)는 샘플링과 양자화라는 두 가지 기능을  수행
-> CCD의 단점: 강한 조명등을 촬영시, 사진에서는 수직으로 번짐현상이 발생.



3. 디지털 영상
⑴크기 계산법
①흑백영상
-> 예: 640 x 480 x 8(bit) = 640 x 480 byte
②컬러영상
-> 예: 640 x 480 x 8(bit) x 3 bit(RGB) = 640 x 480 x 24 byte

⑵파일 형식

①JPG: (색상손실압축)정지영상압축 표준. 현재 JPEG2000으로 좀더 보완됨.
②PNG: 48비트까 컬러 지원(ARGB). 시스템 독립적
③GIF: 애니메이션 가능. Gif와 플래시중, 용량이 많은것은 GIF
④BMP: 압축없이, 데이터를 저장해서 용량이 크다. 대신 구조가 간단해서 I/O속도가 빠름.

⑶파일 구조


⑷컬러맵 동작법

-> RGB가 각각 8비트이므로, 2^24가지 색상 가능.
-> 약 16,000,000트루칼라(1600만)를 인덱스(팔레트)로 변환시, 색상값이 손상됨.흑백체계에도 팔레트는 있다.

⑸비트맵 컬러영상 포현

-> 프레임버퍼상 ‘2’라고 표기되어 있으면, 팔레트 2번을 참조하라는 뜻.
-> 여기서 팔레트는 힙정렬같기도?

⑹RGB칼라 영상
http://bit.ly/eo4zpI
-> 원본이미지와 비교시, RGB채널중 원본에 가장 근접한 채널의 색상이 원본에 많이 들어간것이다.
-> 가령, R채널이 원본과 가장 유사하면 원본에는 RED값이 많이 포함된것이다.

⑺BMP파일 구조

①배열에 담아놓고보면, 위의 자료처럼 뒤집혀 있다.(Vertical Flip)
②영상처리에서는 별로 신경쓰지 않아도 되나, 특정좌표를 집을때만 역위치고려.



4 . 디지털 영상처리 응용
⑴MRI의 연속 단면 영상
-> 의학부야에서는 3차원 영상을 사용. 내장이나 혈관등 내부 기관들의 거리와 상태등을 파악하기 위해서이다.
-> 의료영상은 기본적인 양자화레벨이 높다.

⑵OCR
-> 아르미같은 유틸리티처럼 그림으로 스캔된 문서를 글자로 변환가능? Adobe acrobat의 기능에서 OCR기능

⑶생체인식
①생체인식얼굴=일반카메라얼굴영상=열감지 카메라홍채의 인식률이 용이
-> 얼굴인식은 안경이나 조명 표정등으로 오식가능
②망막이 홍채보다 인식률은 좋아도, 개발과 이미지 확보가 어려움.
③서명은 정확도를 위해서 압력패턴감지도 추가가능
-> 서명입력판(x,y)에다가 압력(0~z)?

⑷DCT 변환을 이용한 영상압축
-> 화상회의 시스템, 디지털 방송(DMB, DVB 등)에 응용되는 영상압축
-> DCT변환시,럼 밝은곳(저주파)쪽으로 쏠림.



 






[참고자료]
http://forum.falinux.com/zbxe/?document_srl=537154
http://www.mathworks.com/help/toolbox/images/f8-20792.html


'프로그래밍note > 멀티미디어' 카테고리의 다른 글

멀티미디어 포맷 요약정리  (0) 2011.12.04
<04>영상 영역처리  (4) 2011.06.03
영상처리 샘플용 이미지  (0) 2011.06.01
<03>영상포인트 처리  (0) 2011.06.01
<01>멀티미디어 정의, 특성  (0) 2011.04.10