본문 바로가기

전체 글81

[정규표현식] 띄어쓰기 쉽게 지우기 (Feat. Notepad++) 설명 프로그래밍에서 문자열을 다룰 때, 문자열의 일정한 패턴을 표현하는 일종의 형식 언어를 말한다. 정규식이라고도 부르며, 보통 RegEx 혹은 RegExp라 많이 쓴다. 자세한 내용은 나무위키에서 확인하는 편이 빠르다. 주로 Notepad++에서 정규표현식을 활용한 바꾸기를 통해 자주 활용하는 편이다. 예시 기호 의미 [] 범위 안에 있는 모든 문자 [^] 범위 내 문자를 제외한 나머지 ^ 행의 처음 $ 행의 끝 \s 공백문자 \S 공백문자 외 모든 문자 \t 탭문자 \r or \n 개행문자 (Enter) \d 숫자 \D 숫자 외 . 모든 문자 | or () 범위 ? 0 or 1 + 0 + 적용사례 2024. 1. 28.
[책 리뷰] 대학원생일 때 알았더라면 좋았을 것들 책 소개 도서명 : 대학원생일 때 알았더라면 좋았을 것들 책 URL : https://www.yes24.com/Product/Goods/72231788 대학원생 때 알았더라면 좋았을 것들 - 예스24 블로그 방문 170만 회! / 슬라이드 쉐어 60만 뷰! / 페이스북 3만 명 팔로워 5만 3,000회 공유! 대학원이라는 미지의 영역에 대한 궁극의 안내서!국내 최초 본격 대학원 생활 사용설명서! 대학에 간다 www.yes24.com 주요 내용 및 소감 대체로 내용은 '박사과정'을 염두에 두고 쓰여졌으며, 어떻게 '연구'를 해야하는지에 주로 초점이 맞춰져 있다. 1권은 대체로 연구에 대한 방법론과 논문 작성 등을 위주로 쓰여져 있으며, 2권은 박사과정 중 겪을 수 있는 여러 어려움(ex. 장학금, 연애, .. 2024. 1. 28.
[Windows] bat 파일 생성 및 작업 스케줄러 등록 설명 반복적으로 수행하는 업무를 자동화하여 windows 내 작업 스케줄러로 등록하여 리눅스 crontab처럼 예약 작업화 프로세스 bat 파일 생성 - @echo off : 명령어 재출력 off - cd ~ : ~ 경로로 이동 - python ~ : py 파일 실행 - pause : 파일 실행 후 cmd 창 정 작업 스케줄러 등록 - 검색 > 작업 스케쥴러 > 동작 > 작업 만들기 로 생성 - '이름' 및 '설명'에 내용 작성 - 트리거 설정 > 반복 주기에 따라 설정 - 동작 > 생성한 bat 파일 등록 2024. 1. 16.
[ORACLE] ORA-01843_월 형식 오류 오류 유형 "cx_oracle.databaseerror: ora-01843: not a valid month" 오류 설명 포맷 방식이 oracle 내부 형식과 맞지 않아 발생하는 오류 다만 python으로 동일한 포맷으로 맞춰 입력하여도 오류 지속 발생 예시) 아래 REG_DT 형식에 맞춰 '23/12/31'과 같은 형식으로 입력하여도 오류 발생 해결 방안 ORACLE 내에서 'YY/MM/DD' 형식으로 출력되는 건 실제로 'YYYYMMDD' 형식인 것으로 추정 하지만 python으로 datetime 데이터를 .strftime('%Y%m%d')로 바꾸어도 오류 지속 발생 때문에 ORALCE 에 날리는 쿼리에서 TO_DATE(입력값, 'YYYYMMDD')를 적용하여 변경 2024. 1. 16.
[ORACLE] ORA-01861_문자열 형식 오류 오류 유형 "cx_oracle.databaseerror: ora-01861: literal does not match format string" 오류 설명 Date에 들어가야 할 부분에서 데이터 타입이 Date에 맞지 않게 들어간 경우에 발생 ex) YYYY-MM-DD 형식으로 들어가야 하나 '20231201' 과 같은 형식으로 들어갈 때 발 해결 방안 python 내에 datetime 데이터를 strftime 메서드를 통해 변경 2024. 1. 16.
구글 뉴스기사 크롤링 (Selenium 문법 변경) 구글 뉴스기사 크롤링 [목차] 1. 셀레니움 및 구글 변경사항 2. 크롤링 코드 1. 셀레니움 및 구글 변경사항 최근 크롤링할 일이 있어 코드를 짜는 중 예전 코드가 작동하지 않는 것을 발견했습니다. 셀레니움이 업데이트되면서 문법 중 변경된 사항이 많았습니다. chromedriver.exe로 활용하지 않음 find_element 문법 변경 구글 또한 크롤링에 대응하고자 변동된 것이 많았습니다. 첫번째 뉴스 페이지 내에 css 문법 미통일 5페이지 단위로 10번째 기사의 css 변동 2. 크롤링 코드 구글의 크롤링 방지 css를 우회하여 특정 키워드 관련 뉴스기사 제목을 수집하는 코드를 작성하였습니다. (2023.11.11. 기준) from seleniumbase import Driver from sele.. 2023. 12. 31.