VIT 관련 자료들 (근본들)

  1. [github] google research : https://github.com/google-research/vision_transformer
  2. [paper] AN IMAGE IS WORTH 16X16 WORDS: TRANSFORMERS FOR IMAGE RECOGNITION AT SCALE <- 이친구가 vit 최초 논문
  3. [paper] MLP-Mixer: An all-MLP Architecture for Vision

Abstract

Introduction

NLP에서의 Transformer 연구 흐름을 말하고있다.

하지만 Vision에서는 transformer 안쓰고 있음

우리는 Transformer를 vision 분야에 적용시켜보려함