티스토리 뷰
outputs = self.bert(...)
sequence_output
- outputs[0]
- shape: (batch_size, max_seq_length, hidden_size)
- 입력 문장의 각 토큰에 대해 임베딩된 값
pooled_output
- outputs[1]
- shape: (batch_size, hidden_size)
- 입력 문장 전체에 대한 [CLS] 토큰의 임베딩 값
Classification 태스크에서는 pooled_output 값을 사용한다.
반응형
'AI > NLP' 카테고리의 다른 글
[SentenceTransformer] special token 추가하기 (0) | 2022.05.24 |
---|---|
FAISS 설명 및 사용법 (0) | 2022.04.28 |
[BlenderBot 2.0] Beyond Goldfish Memory: Long-Term Open-Domain Conversation 논문 리뷰 (0) | 2022.04.06 |
[BlenderBot 2.0] Internet-Augmented Dialogue Generation 논문 리딩 (0) | 2022.03.24 |
언어모델 Decoding Methods (0) | 2022.03.06 |
댓글