[논문 리뷰]Unsupervised Representation Learning By Predicting Image Rotations

2020. 11. 5. 16:36카테고리 없음

  • Authors: Spyros Gidaris, Praveer Singh, Nikos Komodakis
  • ICLR 2018

"Self-supervised" Learning의 한 연구 사례로, 매우 간단하게 네트워크에게 중요한 feature를 학습하도록 할 수 있다.

이전에 발표된 self-supervised 방법론보다 훨씬 쉽고 + 효과적이다.

In the above formulation, the geometric transformations G must define a classification task that should force the ConvNet model to learn semantic features useful for visual perception tasks (e.g., object detection or image classification).

ConvNet model to effectively perform the above rotation recognition task unless it has first learnt to recognize and detect classes of objects as well as their semantic parts in images.

Details

  • 수직 각도(0,90,180,270)가 좋은 것은, flip과 transpose만으로 구현이 가능하기 때문에 기하 변형을 거쳤을 때 쉽게 발견 될만한 low-level artifacts가 없다.
  • 무작위로 한 번에 한 각도를 주는 것이 아닌, 한 번에 모든 각도를 동시에 주고 맞추는 문제를 풀게 하면 성능에 더욱 효과적.
  • 여러 rotation 각도를 학습하도록 할수록 좋을 것이라고 생각되지만, 오히려 4개의 수직각도 (0, 90 , 180, 270)을 구분하는 것이 가장 좋았다.
    • 앞서, 45도 각도에 대해서는 artifact가 발생할 수 있기 때문에로 해석할 수 있다.
    • 개인적인 의견: 데이터셋에 따라 다를 것 같다.
  • 배경을 통해서 쉽게 네트워크가 학습하지 않도록 전처리를 거친다.