Notice
Recent Posts
Recent Comments
Link
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
Tags
- 다중 선형 회귀
- 깃헙 블로그 오류
- re
- githubblog
- AWS
- beatuifulsoup4
- ChatGPT
- re.compile
- 지연평가
- Selenium
- LinkedLists
- 정규표현식
- Python
- 정규표현식 조건문
- list
- 병렬처리
- ruby error
- 파이썬
- simple-regression model
- 통계학
- 중복성검사
- reverse_lazy
- 2023운전면허
- 넓이 우선 순회
- de
- 평가지표
- chirpy
- GPT-4
- 벌크업데이트
- 비용이슈
Archives
- Today
- Total
용사냥꾼69
re 패키지를 사용한 병렬처리 시의 주의사항 본문
728x90
상황
re 패키지를 사용하여 정규표현식을 통해 병렬처리로 수 많은 문장을 검수해야 하는 상황이 있었습니다.
문제 발생
지속적으로 몇몇 문장에서 코드와는 전혀 다른 문제가 발생했고, 디버깅을 하다보니 결국 정규표현식의 문제라고 판단했습니다.
해결책
re 패키지에 대한 정보를 검색하던 도중 알아낸 사실은
re.compile으로 만들어진 패턴들은 cache에 저장되며, 이는 최대 100개까지고 이보다 많아질 경우 초기화된다는 것입니다.
수 많은 패턴들이 동시에 생성되는 형태의 병렬처리의 경우 초기화되면서 문제가 발생할 수 있습니다.
이 부분에 대해서 유의하면서 병렬처리를 진행해야 합니다.
re.compile이 모든 상황에서 필요한 것은 아닙니다.
'파이썬 > 파이썬-AI 기본' 카테고리의 다른 글
웹스크래핑, beatuifulsoup4 (0) | 2023.04.19 |
---|---|
다중 선형 회귀와 회귀모델에 대한 평가 지표, 그리고 과적합과 과소적합 (0) | 2023.04.14 |
문장 중간의 특정 문자만 선택하기-정규표현식을 활용 (0) | 2023.02.25 |
단순선형회귀모델을 알아야 복잡한 모델을 안다 (0) | 2023.02.25 |
왜 K-means 클러스터링을 사용하는가? (0) | 2023.02.18 |
Comments