VISION HONG
article thumbnail
[논문리뷰] RandAugment
Deep Learning 2021. 5. 23. 18:02

RandAugment: Practical automated data augmentation with a reduced search space Ekin D. Cubuk ∗ , Barret Zoph∗ , Jonathon Shlens, Quoc V. Le Google Research, Brain Team 이번 포스팅에서는 google brain에서 2019년 10월에 발표한 RandAugment라는 논문에 대해 알아보려고 한다. 이 논문의 중점은 기존의 Auto Augmentation의 search space보다 훨씬 낮은 space로 비슷한 성능을 낼 수 있다는 것이다. What is RandAugment? data augmentation은 딥러닝 모델을 일반화시키는데에 도음을 주는 중요한 작업이다. 하지만..

article thumbnail
[논문리뷰] MLP-Mixer
Deep Learning 2021. 5. 18. 15:57

MLP-Mixer: An all-MLP Architecture for Vision Ilya Tolstikhin∗ , Neil Houlsby∗ , Alexander Kolesnikov∗ , Lucas Beyer∗ , Xiaohua Zhai, Thomas Unterthiner, Jessica Yung, Daniel Keysers, Jakob Uszkoreit, Mario Lucic, Alexey Dosovitskiy ∗ equal contribution Google Research, Brain Team 오늘은 2021년 5월에 나온 논문 MLP-Mixer에 대해 알아보려고 한다. 이 논문은 ViT와 마찬가지로 Google Research에서 발표하였고 핵심 아이디어는 ViT가 self attention만으로..

article thumbnail
[논문리뷰] Vision Transformer(ViT)
Deep Learning 2021. 5. 15. 22:26

논문에 대해 자세하게 다루는 글이 많기 때문에 앞으로 논문 리뷰는 모델 구현코드 위주로 작성하려고 한다. AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE Alexey Dosovitskiy∗,† , Lucas Beyer∗ , Alexander Kolesnikov∗ , Dirk Weissenborn∗ , Xiaohua Zhai∗ , Thomas Unterthiner, Mostafa Dehghani, Matthias Minderer, Georg Heigold, Sylvain Gelly, Jakob Uszkoreit, Neil Houlsby∗,† ∗ equal technical contribution, † equal advis..

article thumbnail
비전 프로젝트 : CVFM(Computer Vision For Market)
Project 2021. 5. 1. 17:44

Project : CVFM(Computer Vision For Market) DATE : 2021-04-01 ~ 2021-05-06 Member : 홍은표, 최정훈, 윤성현 WHAT : 고객이 과일을 고른 후에 카운터에 과일을 올려 놓으면 카운터에 설치된 카메라를 통해 과일을 검출하여 현재 과일 가격에 맞는 총 액수를 계산을 하고 모니터를 통해 고객이 바로 결제를 할 수 있도록 하는 무인 결제 시스템 WHY : 아이디어가 과일가게에 국한되지 않고 일반적인 마트, 편의점 등에 적용을 할 수가 있으며 이를 통해 인건비, 야간의 범죄 노출, 잦은 알바생 교체로 인한 고용주의 스트레스 등 사람이 일을 했을때의 많은 문제점을 해소할 수 있으며 더 나아가 기존 무인 시스템(바코드, RFID 등)에 비해 유지보수 측..

article thumbnail
Pytorch 함수 및 팁 저장소(상시 추가)
Pytorch 2021. 4. 19. 01:18

Function torch.roll(input, shifts, dims) roll함수는 input 매트릭스값을 원하는 dimension으로 shift하는 기능을 수행한다. x = torch.tensor([1, 2, 3, 4, 5, 6, 7, 8]).view(4, 2) print(x) print(torch.roll(x, shifts=(3,1), dims=(0,1))) # y축으로 3번 밀고 x축으로 1번민다는 의미 -------------------------------------------------- tensor([[1, 2], [3, 4], [5, 6], [7, 8]]) tensor([[3, 4], [5, 6], [7, 8], [1, 2]]) Tips 1. torch.load_state_dict() ..

article thumbnail
[논문리뷰] EfficientNet
Deep Learning 2021. 2. 21. 15:00

이번 포스팅에서는 Google Brain에서 2019년에 발표한 EfficientNet: Rethinking Model Scaling for Convolutional Neural Networks(Image Classfication) 논문에 대해 리뷰하려고 한다. 1. Introduction 본 논문에서는 어떻게 Network를 확장해야 효율적일지에 대한 연구가 진행되었고 그 결과 기존 Network보다 파라미터 대비 정확도가 높은 효율적인 Network를 제시하였으며 효율적인 Network라는 이름을 본따 EfficientNet으로 정하였다. 위 사진을 보면 EfficientNet이 SOTA image classification network보다 효율적인 모델임을 알 수 있다.(B0~B7는 모델 사이즈를..