VISION HONG
article thumbnail
[논문리뷰] SSD : Single Shot Multibox Detector
Deep Learning 2021. 1. 23. 15:34

SSD : Single Shot Multibox Detector는 2016년 ECCV(European Conference on Computer Vision) 학회에서 발표되었다. 이름에서부터 알 수 있듯이 Object Detection 논문이며 당시 SOTA였던 Faster_RCNN 과 YOLO v1의 단점들을 보완하면서 화제가 된 논문이다. 1. Introduction Faster_RCNN 과 YOLO v1은 다음과 같은 단점들을 가지고 있었다. Faster_RCNN 단점 : 이름은 Faster이지만 그에 걸맞지 않게 연산량이 많고 너무 느리다. (only 7 FPS with mAP 73.2%) YOLO v1 단점 : 다른 Object Detector에 비해 빠르지만 accuracy가 낮다. (45 F..

article thumbnail
mAP(Mean Average Precision) [2]
Deep Learning 2021. 1. 21. 20:34

mAP(Mean Average Precision) 저번 mAP(Mean Average Precision) [1] : visionhong.tistory.com/5 포스팅 에서는 MAP를 알기위해 필요한 지식에 대해 주로 다루었고 이번 포스팅에서는 MAP계산 과정을 실제 코드와 함께 알아보자. Review 우선 강아지라는 1개의 클래스에 대해서만 생각해보자. mAP를 계산하기 위해서는 prediction box와 test set의 ground truth가 필요하다. 3개의 이미지에는 4개의 Ground truth가 있으며 7개의 prediction이 confidence와 함께 주어진다. 그리고 각 이미지에 대해 ground truth와 prediction의 IOU가 0.5 이상인 것은 TP(True Posi..

article thumbnail
NMS(Non Max Suppression)
Deep Learning 2021. 1. 21. 14:24

NMS(Non Max Suppression) 이번 포스팅 에서는 IOU에 이어서 NMS(Non Max Suppression)에 대해 알아보려고 한다. NMS는 여러 Object Detection논문(YOLO, SSD 등)에서 사용한 방법으로 각각의 물체에 대한 bounding box를 제일 잘 나타낸 1개의 box만 두고 나머지를 제거하는 기법이다. 자세히 알아보자. 모델이 위 그림과 같이 box를 예측했다고 해보자. 어떤 박스는 자동차를 거의 완벽하게 내포하고 있고 몇몇 박스는 조금씩 아쉽게 위치한 것을 볼 수 있다. 여기서 우리가 원하는 것은 이 박스들 중에 자동차를 가장 잘 포함시킨 박스 하나만 남겨서 깔끔하게 만드는 것이다. 이러한 작업은 어떻게 이루어 질까? 다시 박스를 바꿔서 모델이 위와 같은..

article thumbnail
IOU(Intersection over union)
Deep Learning 2021. 1. 20. 23:07

IOU(Intersection over union) 이번 포스팅에서는 많은 Object Detection 논문에서 사용하는 IOU(Intersection over union) 에 대해 알아보자. 참고로 IOU는 jaccard overlap 이라고도 불린다. 위의 그림을 보면 Prediction은 Ground truth와 꽤 겹치는 듯 하면서도 만족스럽지는 못한 것을 알 수있다. 이러한 차이를 어떤 방법으로 Prediction과 Ground trutt를 비교하면서 평가를 할 수 있을까? 바로 왼쪽 그림의 두 박스의 교집합과 오른쪽 그림의 합집합을 이용을 하면 prediction이 얼마나 ground truth와 겹쳐 있는지 수치적으로 비교할 수 있다. 즉 IOU는 이름에서부터 알 수 있듯이 두 박스(pre..

article thumbnail
[논문리뷰] MobileNets V1
Deep Learning 2021. 1. 4. 01:23

MobileNets : Efficient Convolutional Neural Networks for Mobile Vision Applications 이번 포스팅에서는 구글에서 2017년 10월에 발표한 논문 MobileNet에 대하여 다뤄 보려고 한다. 사실 이 논문에서는 어떤 새로운 방법론에 대해 다뤘다기 보다 기존의 CNN의 무거운 네트워크를 수정하는 내용을 다루고 있다. 컴퓨터 비전에 대한 상업적인 요구사항을 두가지 관점에서 생각해 보면 다음과 같다. 1. Data-centers(clouds) - Rarely safety-critical - Low power is nice to have - Real-time is preferable 2. Gadgets= Smartphones, Self,drivin..

article thumbnail
Batch Normalization
Deep Learning 2021. 1. 2. 21:20

이번 포스팅에서는 Batch Normalization에 대해 알아보려고 한다. 레이어 수가 많이질수록 즉 망이 깊어질수록 vanishing/exploding gradient 문제로 인해 학습이 잘 되지 않았고 그것을 해결하기위해 activation function 변경, dropout, regularization 방법 등이 제시 되었지만 여전히 골칫거리로 남아있었다. 이 문제를 해결하기 위해 나온것이 이전 포스팅에서 다룬 ResNet 과 Batch Normalization이다. 천천히 Batch Normalization에 대해 알아보자. What is vanishing / exploding gradient ? vanishing gradient : 학습과정에서 backpropagation을 하면서 grad..