KL-Divergence Loss

티스토리 뷰

KL-Divergence Loss

체봄 2023. 12. 23. 19:13

KL-Divergence (KLD)는 쉽게 말해, 정답(ground-truth) 분포와 예측(prediction) 분포가 얼마나 유사한지/다른지를 측정하는 방법이다.

KLD의 값이 낮을수록 두 분포가 유사함을 의미한다.

$P(x)$ 를 실제 분포, $Q(x)$ 를 예측 분포라고 할 때, KLD loss는 다음 수식으로 나타낼 수 있다.

$KLD = \displaystyle\sum_{x} P(x) \log \frac{P(x)}{Q(x)} = \displaystyle\sum_{x} P(x) \log P(x) - \displaystyle\sum_{x} P(x) \log Q(x)$

추가적으로, 우항에서 $\displaystyle\sum_{x} P(x) \log P(x)$ 는 $-Entropy$ 이고, $- \displaystyle\sum_{x} P(x) \log Q(x)$ 는 $Cross Entropy$ 이기 때문에, 다음의 사실을 알 수 있다.
$KLD = - Entropy + Cross Entropy$

참고 링크: https://hwiyong.tistory.com/408

저작자표시

'AI' 카테고리의 다른 글

Rotary Positional Embedding (RoPE)에 대해 알아보자 (0)	2025.04.12
[논문 리뷰] P-Tuning v2: Prompt Tuning Can Be Comparable to Fine-tuning Universally Across Scales and Tasks (0)	2023.08.01
[Pytorch] nn.BCELoss(), nn.CrossEntropyLoss() (0)	2023.04.12
모델의 특정 layer를 freeze시키기 (0)	2023.02.02
GPU id 지정하여 학습하기 (0)	2022.06.06

내 블로그 - 관리자 홈 전환	`Q` `Q`
새 글 쓰기	`W` `W`

글 수정 (권한 있는 경우)	`E` `E`
댓글 영역으로 이동	`C` `C`

이 페이지의 URL 복사	`S` `S`
맨 위로 이동	`T` `T`
티스토리 홈 이동	`H` `H`
단축키 안내	`Shift` + `/` `⇧` + `/`

NLP 성장러의 아카이브

티스토리 뷰

KL-Divergence Loss

'AI' 카테고리의 다른 글

티스토리툴바

개인정보

단축키

내 블로그

블로그 게시글

모든 영역