4억개의
Prerequisite
Contrasive Learning
- 주로 self-supervised learning에서 사용되는 방법론 중 하나
- 학습 과정
- 학습 데이터 속 샘플 쌍의 유사도를 라벨로 삼아 representation learning을 수행
- 비슷한 샘플은 embedding space 에서의 거리가 가깝도록, 다른 샘플은 멀도록 학습
- 학습 데이터 속 샘플 쌍의 유사도를 라벨로 삼아 representation learning을 수행
- Loss Function
-
InfoNCE
-
데이터셋
- 인터넷에서 4억개의 (Image-Text) 쌍을 수집함