이 포스트는 위키독스의 딥러닝을 이용한 자연어 처리 입문을 기반으로 작성되었습니다.
이번에는 문서 유사도를 구하는 공식들인 코사인 유사도(cosine similarity), 유클리드 거리(euclidean distance), 자카드 유사도(Jaccard similarity)에 대해 알아보자.
반응형
'DATA SCIENCE > NLP' 카테고리의 다른 글
[NLP] 임베딩(Embedding) 개념 (0) | 2020.04.29 |
---|---|
[NLP] 토픽 모델링 (Topic Modeling : LSA & LDA) (0) | 2020.03.28 |
[NLP] 횟수(count) 기반 단어 표현 방법 (0) | 2020.03.28 |
[NLP] 언어 모델 (Language Model) (0) | 2020.03.28 |
[NLP] 텍스트 마이닝 (Text Mining) (0) | 2020.03.28 |