vision 3

[Albumentation] CropAndPad로 이미지에 패딩 처리하기

Intro Vision 분야에서 Deep learning 모델을 학습 시키려면 많은 양의 Image 데이터가 필요하다. 이때, 우리가 가질 수 있는 Image 데이터의 수에는 사실상 한계가 존재하기 마련인데- 이를 조금이나마 극복할 수 있게 도와주는 좋은 툴이 존재한다. 이름하여 `Albumentation` !!! Albumentation 공식 사이트 CropAndPad 오늘은 그중에서도 `CropAndPad`라는 패키지를 살펴보려고 한다. 내가 직면했던 문제점은, 모델을 학습시킨 이미지의 비율(1:1 이미지로 학습됨)과 모델 성능을 평가하려는 이미지의 비율(16:9 사진으로 평가)가 달랐다는 것에서부터 출발했다. 자주 발생하는 이슈인지는 모르겠으나, 모델을 학습시킨 이미지들의 경우 (이미 엄청난 품이 ..

[Idea/Notes] 디지털 이미지는 왜 직사각형일까?

문득 '사람의 눈으로 보는 시야를 디지털화 하면 모양이 == 직사각형일까?' 라는 생각이 들었다. 왜냐하면 컴퓨터가 인식하는 vision image들은 다 '직사각형', '큐브(RGB채널을 높이로 생각하면)'처럼 각져있기 때문이다. 그런데 사람이 보는 시야는, 직사각형의 edge라고 부를 수 있는 경계가 없을 것 같다. blur처리 되어 있지 않을까...? 컴퓨터가 인식할 수 있는 세상이, 사람의 시야와 다른 점은 분명 존재한다.

Notes 2022.05.03