4억개의

Prerequisite

Contrasive Learning

  • 주로 self-supervised learning에서 사용되는 방법론 중 하나
  • 학습 과정
    • 학습 데이터 속 샘플 쌍의 유사도를 라벨로 삼아 representation learning을 수행
      • 비슷한 샘플은 embedding space 에서의 거리가 가깝도록, 다른 샘플은 멀도록 학습
  • Loss Function

데이터셋

  • 인터넷에서 4억개의 (Image-Text) 쌍을 수집함