본문 바로가기
[SQL] Percentile 함수_백분위수 구하기 설명 percentile_disc : ~% 백분위에 해당하는 값을 반환 (이산 분포 모델 가정) ex) percentile_disc(0.15) : 전체 값 중 15%에 해당하는 값을 반환 (특정 값을 반환) percentile_cont : ~% 백분위에 해당하는 값을 보간하여 반환 (연속 분포 모델 가정) ex) percentil_cont(0.15) : 전체 값 중 15%에 해당하는 값을 반환 (정확한 값이 없는 경우 계산하여 반환) 예시 2023. 2. 5.
[SQL] Corr 함수_상관관계 구하기 설명 숫자로 이루어진 컬럼들 사이의 상관관계 출력 corr(`컬럼명1`, `컬럼명2`) 예시 2023. 2. 5.
[SQL] Generate series 함수_ 등차수열 만들기 설명 generate_series(`시작 숫자`, `끝 숫자`, `간격 크기`) 등차수열 함수 (소수점 가능) 예시 2023. 2. 5.
[SQL] Trunc 함수_소수점 버리기 설명 round 함수와 달리, 기준 소수점 이하의 숫자를 버리는 함수 ex) round(3.4567,2) = 3.46 ex) trunc(3.4567, 2) = 3.45 예시 2023. 2. 5.
[거친코딩] 통계검정에서 정규성검정 꼭 필요할까? 선요약 A/B 테스트를 진행해야 할 때 3가지 조건을 만족해야 한다. [독립성 검정] 실험을 진행할 두 그룹을 나눌 때 '서로 영향을 안주는 독립적 그룹'이어야 한다. [등분산성] 두 그룹은 '서로 동일한 분산 형태를 갖는 등분산성'이어야 한다. [정규성] 두 그룹은 '정규성을 만족'하여야 한다. 왜도(skewness)가 2보다 작아야 한다. 첨도(kurtosis)가 7보다 작아야 한다 참고자료 https://www.youtube.com/watch?v=JXD9dKIU67M 내용 A/B테스트를 위해 t-Test를 진행할 때 만족해야 하는 조건들이 존재한다. 다만 정규성 검정의 경우, 통계검정 방식을 사용하면 실제 데이터는 생각보다 정규성 검정을 만족하지 못하는 경우가 많다. 때문에 이를 보완하기 위해서 '.. 2023. 1. 29.
[SQL] Temp Table 함수_임시테이블 만들기 설명 임시 테이블 생성 함수 CREATE TEMP TABLE [테이블명] AS SELECT [사용하고자 하는 컬럼명, ~] FROM [기존 테이블] 예시 새로운 임시테이블 만들기 table 이라는 테이블에서 column1, colunm2로만 이루어진 new_tablename 이라는 임시테이블 만들기 기존에 있는 데이터(컬럼)만 추출해서 새로운 테이블 만들기 top_companies라는 임시 테이블을 만든다 임시테이블 내에는 fortune500 테이블에서 rank가 10위 안에 드는 데이터 중 rank, title 컬럼을 가져온다. 2023. 1. 29.