이 포스트는 위키독스의 딥러닝을 이용한 자연어 처리 입문을 기반으로 작성되었습니다.
이번에는 단어를 표현하는 방법인 국소 표현(local representation)과 분산 표현(distributed, continuous representation)과 BoW(Bag of Words), DTM(Document Term Matrix) 그리고 TF-IDF를 계산하는 방법에 대해 알아보자.
반응형
'DATA SCIENCE > NLP' 카테고리의 다른 글
[NLP] 토픽 모델링 (Topic Modeling : LSA & LDA) (0) | 2020.03.28 |
---|---|
[NLP] 문서 유사도 (Document Similarity) (0) | 2020.03.28 |
[NLP] 언어 모델 (Language Model) (0) | 2020.03.28 |
[NLP] 텍스트 마이닝 (Text Mining) (0) | 2020.03.28 |
[NLP/Python] 정규표현식 (re) (0) | 2020.02.10 |