노력과 삽질 퇴적물
멀티미디어에는 다양한 포맷들이 사용되고 있다. 여기서는 이미지, 동영상, 음악, 압축에 대한 포맷간 장단점에 정리해두고자 한다. 가끔씩 깜박하거나, 헷갈리는 경우가 많아서이다. 1. 이미지 ① 대중적인거 *.JPG: Joint Photographers Expert Group -> 사람의 눈에 [간상체 갯수, 명암구분>>추상체 갯수, 색상구분]라서 색상값을 눈치 못챌정도로만 덜어내는것으로 용량을 줄임. -> 알파값이나, 애니메이션불가. *.GIF: Graphics Interchange Format -> 동영상꼬랑지라든가, 움짤에 쓰임. -> RGBA가능. -> 다른 이미지 포맷에 비해, 그라데이션 표현이 투박. 디더링같은 손질이 필요 *.PNG: Portable Network Graphics -> 이미지 ..
1. 영상 영역처리 ⑴ 영상 공간주파수 ① 저주파영역: 상대적으로 밝기의 변화가 극소적인 영역 -> 사람의 눈은 색상보단 빛의 강약을 더 감지하기때문에 저주파에민감 ②고주파영역: 상대적으로 밝기의 변화가 큰 영역(경계선으로도 쓰임) 2. 컨볼루션 ⑴ 컨볼루션 ① 용도 -> 노이즈 제거: dinoising -> 스무딩: 고주파영역 감쇄 -> 샤프닝 -> 경계선검출: 고주파를 이용한 검출 -> 모자이크: 특정 영역의 고주파를 없앤다. ② 영역밖 처리법 -> 꼭지점에 입력화소가 있을떄 발생한다. -> Zero-padding: 컨볼류션 창의 비어있는 셀(cell)은 0으로 처리 -> Warp-around convolution: 영상의 모서리가 서로 연결되어 있는 것처럼 처리(지도를 지구본으로 만드는걸 연상) ⑵..
1.영상신호처리 ⑴ 영상 영역처리 ⑵ 픽셀단위 산술연산 덧셈연산OutImage[i][j] = InImage[i][j]+C1 뺄셈연산OutImage[i][j] = InImage[i][j]-C2 곱셈연산OutImage[i][j] = InImage[i][j]*C3 덧셈, 뺄셈의 경우, 포토샾 [이미지-조정-명도/대비] 참고로, negative(반전)은 각 픽샐마다 [255-x]처리. 어두운 값이 밝아지고 밝은 값이 어두워진다. ⑶ 밝기값 히스토그램 -> 명암대비 및 명암값 분포에 대한 정보 제공 -> 임계치는 T같은 계곡값에 적당. void Histogram() { int k=0, sum =0, total_pixels=0; int hist[256]; // Histogram의 빈도수 저장 int sum_of_h..
1. 사람눈의 특징 ⑴눈의 구조: '보기'라는 동작에서 눈이 수행하는 행동은 아래의 2가지 ①To recognize details of a scene (the spatial resolution of the scene) ②To recognize changes in a scene (the temporal resolution of a scene) -> ㅁㅁ을 본다 = 원래장면의 요소요소 - 지금 장면의 요소요소 = 요소의 변화 ⑵망막: 수정체를 통해 들어온 빛이 망막에서 상이 맺힘. ①원추체(cone) 시세포: 색채판별. 약 120*10^6개 -> RGB값에서 G>R>B순으로 예민하게 감지할수 있다. ②간상체(rod) 시세포: 명암판별. 약 8*10^6개 -> 세포의 분포상, 색상보다는 빛의 감광을 더 예민하..
1. 멀티미디어란? -> 텍스트, 이미지등의 전혀 다른 여러 가지 (multi-) 매체 (media)의 혼합 2. 멀티미디어 종류 멀티미디어의 종류 = {사운드, 비디오, 애니메이션, 사진, 텍스트, 그래픽스} 시간기반-> t변화량에 따라 인지 및 출력되는 내용이 달라짐. 공간기반-> 어느 위치를 보는가에 따라 다른것이 인지. ① 사운드 -> Hz = 파동주기 개수 / 1초 -> 고주파 = 헤르츠값이 높다. = 높은 음. ② 비디오 -> 연속되는 영상으로 정보량이 많다. -> 단위: FPS, 초당 프레임률 -> 15FPS 정도는 되어야 연속된 동작으로 인식. ③ 애니메이션 -> 연속되는 이미지들 ④ 이미지 -> BitMap(BMP, 무손실압축)방식으로 저장. -> 각 픽셀별로 정보를 저장. ⑤ 텍스트 -..