본문 바로가기

DATA SCIENCE/NLP

[NLP/Python] 정규표현식 (re)

. 임의의 문자 1개 (\n 제외)
a? a가 최소 0개 최대 1개 존재 
a* a가 최소 0개 이상 존재
a+ a가 최소 1개 이상 존재
^a a로 문자열 시작
a$ a로 문자열 종료

ex1) 단어 사이 띄어쓰기 상관 없이 찾아서 대체하기

import re
sentence = re.sub('불편.?사항', '불편', sentence)

ex2) 여러 단어 한꺼번에 find할 때

import re
for word in re.finditer('없음|없다|없고', sentence):
    print(word.start(), word.end())

 

반응형