. | 임의의 문자 1개 (\n 제외) |
a? | a가 최소 0개 최대 1개 존재 |
a* | a가 최소 0개 이상 존재 |
a+ | a가 최소 1개 이상 존재 |
^a | a로 문자열 시작 |
a$ | a로 문자열 종료 |
ex1) 단어 사이 띄어쓰기 상관 없이 찾아서 대체하기
import re
sentence = re.sub('불편.?사항', '불편', sentence)
ex2) 여러 단어 한꺼번에 find할 때
import re
for word in re.finditer('없음|없다|없고', sentence):
print(word.start(), word.end())
반응형
'DATA SCIENCE > NLP' 카테고리의 다른 글
[NLP] 토픽 모델링 (Topic Modeling : LSA & LDA) (0) | 2020.03.28 |
---|---|
[NLP] 문서 유사도 (Document Similarity) (0) | 2020.03.28 |
[NLP] 횟수(count) 기반 단어 표현 방법 (0) | 2020.03.28 |
[NLP] 언어 모델 (Language Model) (0) | 2020.03.28 |
[NLP] 텍스트 마이닝 (Text Mining) (0) | 2020.03.28 |