Blog Content

    티스토리 뷰

    Object Detection

    1. Object Detection이란?


    Object Detection은 Image Classification task에 사물의 위치를 Bounding Box로 예측하는 Regression task가 추가된 문제!

    multi-labeled classification : 한 이미지에 여러 class 존재

    boounding box regression : box의 좌표 값을 예측

    따라서 Object Detection = Multi-labeled Classification + Bounding Box Regression

    2. Sliding Window


    다양한 scale의 window를 이미지의 왼쪽 위부터 오른쪽 아래까지 sliding하며 score를 계산하는 방법을 의미.
    하나의 이미지에서 여러번 score를 계산하여야 하므로 속도 측면에서 비효율적

    3. Selective Search (SS)

    영상의 계층적 구조를 활용하여 영역을 탐색하고 그룹화하는 과정을 반복하며 객체의 위치를 proposal 해주는 기능을 수행

    4. R-CNN?


    Object Detection에 CNN을 적용한 첫 논문으로, Selective Search와 CNN을 결합한 방법론

    input image가 있으면 Selective Search를 통해 Region Proposal을 수행함.
    그 뒤 Proposal된 영역들을 CNN의 고정 사이즈를 가지는 입력으로 변환시키고, 각 영역마다 Classification을 수행하는 방식으로 되어있음.
    또한 Proposal된 Region에서 실제 object 위치와 가까워지도록 보정해주는 Regression도 수행됨.

    1-Stage Object Detector : 탐색 영역을 찾는 Region Proposal과 해당 영역을 분류하는 Detection 두 가지 과정을 한번에 처리하는 방법론
    - SSD, YOLO
    - 빠르지만 부정확하다

    2-Stage Object Detector : 두 가지 과정이 순차적으로 수행되는 방법론
    - Fast R-CNN, Faster R-CNN
    - 비교적 느리지만 정확하다


    Comments