정규 표현식은 양도 방대하기 때문에 사용방법을 코드로 정리하도록 하겠습니다.
가장 기본적인 표기법
1. \d - 숫자와 매치된다. [0-9]와 동일한 표현식이다.
2. \D - 숫자가 아닌 것과 매치된다. [^0-9]와 동일한 표현식이다.
3. \s - 화이트스페이스(whitespace) 문자와 매치된다. [ \t\n\r\f\v]와 동일한 표현식이다. 맨 앞의 빈칸은 공백 문자(space)를 의미한다.
4. \S - 화이트스페이스 문자가 아닌 것과 매치된다. [^ \t\n\r\f\v]와 동일한 표현식이다.
5. \w - 문자+숫자(alphanumeric)와 매치된다. [a-zA-Z0-9_]와 동일한 표현식이다.
6. \W - 문자+숫자(alphanumeric)가 아닌 문자와 매치된다. [^a-zA-Z0-9_]와 동일한 표현식이다.
7. ^ - 해당 패턴으로 시작
8. $ - 해당 패턴으로 종료
예시
import re
# 전화번호 정규식
phone_pattern = r"\d{3}-\d{4}-\d{4}"
# 이메일 정규식
email_pattern = r"[a-zA-Z0-9._+-]+@[a-zA-Z0-9]+\.[a-zA-Z]{2,4}"
# 주민번호 정규식
jumin_pattern = r'\d{6}-\d{7}'
관련함수(자주 사용하는것들 위주로)
- re.findall(정규식패턴, 문자열): 문자열에서 정규식과 매칭되는 모든 부분을 찾아서 리스트로 반환( 없으면 빈 리스트[] )
- re.match(정규식패턴, 문자열): 문자열의 처음부터 정규식과 매칭되는 부분을 찾아서 match 객체 반환. (없으면 None)
- re.search(정규식패턴, 문자열): 문자열에서 정규식과 매칭되는 첫번째 부분을 찾아서 match 객체 반환. ( 없으면 None )
- re.finditer(정규식패턴, 문자열): 문자열에서 정규식과 매칭되는 모든 부분을 찾아서 match 객체들을 포함한 iterator 객체를 반환
'파이썬 > 정리' 카테고리의 다른 글
find vs index - Python (0) | 2023.09.10 |
---|---|
순열과 조합 - Python (0) | 2023.09.10 |
람다함수(익명함수) (0) | 2023.09.10 |
진법 변환 함수 (0) | 2023.07.26 |
Python deque (0) | 2023.07.04 |