VISION HONG
article thumbnail
[논문리뷰] ResNet
Deep Learning 2021. 1. 1. 20:17

2014년에는 ILSVRC 대회에서 GoogleNet 이 1등(6.7% 에러율) VGGNet이 2등(7.3% 에러율)을 차지하였다면 2015년에는 ResNet이 3.57%의 에러율을 가지며 전년도 1~2등의 에러율의 거의 절반에 가까운 성능을 보이면서 압도적으로 1등을 하였다. ResNet은 그 유명한 'Kaiming He'님이 설계를 하였고 당시 마이크로소프트 북경연구소, 현재는 FAIR(Facebook AI Research에 소속되어 계신다. ResNet의 가장 큰 특징이라고 하면 깊은 망(레이어)와 residual learning인데 논문 내용을 통해 ResNet에 대해 자세히 알아보자. 깊은 망의 문제점 CNN에서 파라미터를 업데이트 할때 gradient 값이 너무 크거나 작아지게 되면 더이상 학..

article thumbnail
[논문리뷰] VGGNet
Deep Learning 2020. 12. 30. 16:06

VGGNet이란? VGGNet은 2014년 이미지넷 대회에서 준우승을 한 모델이며 옥스포드 대학의 연구팀 VGG에서 발표를 하였다. 정식명칭이 Visual Geometry Group인 이 모델은 아직까지도 backborn architecture로 사용되고 있을정도로 괜찮은 구조를 가지고 있다. 원래 이 VGGNet의 목적은 CNN의 깊이가 image classification 에 어떤 영향을 끼치는지 알아내기 위함이었다고 한다. 그래서 VGGNet의 이름은 레이어의 수로 구분을 할 수 있게 되는데 현재 많이 인용되는 네트워크는 VGG16 과 VGG19이다. 뒤에붙은 16과 19가 바로 네트워크 레이어의 수 이고 여기서 중요한건 weight를 가진 레이어(convolution layer,fully conn..

article thumbnail
mAP(Mean Average Precision) [1]
Deep Learning 2020. 12. 16. 22:10

mAP(Mean Average Precision)는 Object Detection분야에서 사용되는 성능평가 방법이다. mAP를 알기 위해서는 AP(Average Precision)를 알아야 하고 AP를 알기 위해서는 precision(정밀도)과 recall(재현율)에 대한 지식이 있어야 한다. 천천히 알아보자. Precision & Recall precision은 정밀도라고 부르며 모델이 검출한 모든 결과중에 옳게 검출한 비율을 의미한다. Recall은 재현율이라고 부르며 모델이 검출해내야하는 결과중에 옳게 검출한 비율을 의미한다. Precision과 Recall 둘중 하나만 가지고 성능을 평가하기엔 무리가 있다. 예를들어 사진에서 10명의 사람을 검출해 내야 하는데 모델이 검출해낸 사람은 5명이고 그 ..

article thumbnail
albumentations (Data Augmentation)
Deep Learning 2020. 12. 13. 17:31

CNN 학습에서 데이터 augmentaion은 test 정확도를 향상시키는데에 중요한 역할을 한다. 현재 다양한 data augmentation 기법들이 존재하는데 빠르고 직관적이며 sequential하게 데이터 augmentation을 할 수 있도록 도와주는 라이브러리인 albumantations에 대해 글을 쓰려고 한다. Reference : https://github.com/albumentations-team/albumentations albumentations-team/albumentations Fast image augmentation library and easy to use wrapper around other libraries. Documentation: https://albumentati..