🧠 공부/통계학

[ADP 2과목] 통계분석의 이해

소리331 2024. 7. 13. 23:17
반응형

통계자료를 획득하는 방법 

총조사/ 전수조사  
표본조사 Simple Random Sampling:  단순랜덤 추출법, 임의의 n 개 추출
Systematic Sampling: 계통 추출법 k번째마다 하나씩 뽑는 방법( k, 2k, 3k, ... )
Cluster Random Sampling: 집락추출법: cluster를 구성해서 군집마다 하나씩 ( ex, 지역별 n명)
Stratified Random Sampling: 층화추출법:계층에서 뽑는 방법

척도

명목척도 어느 집단에 속하는지 카테고리 분류할 때 
순서척도 대상의 서열과 순서를 측정할 때 
구간척도 구간사이의 간격이 의미 있을 때
비율척도 간격에 대한 비율이 의미가 있는 자료 (절대적 기준인 0이 존재, 사칙연산 가능)

확률 분포

이산형 - 확률질량함수(pmf - mass)

베르누이 확률 분포 결과가 2개일때(1회)
이항분포 베르누이를 n 회 실행
기하분포 베르누이 시행에서 첫번째 성공이 있을 때까지 x 번 실패할 확률
다항분포 이항분포의 확대
포아송분포 시공간에서 발생하는 사건의 발생횟수에 대한 확률분포 

연속형 - 확률밀도함수(pdf - density)

Uniform 균일분포, 모든 구간이 동일
Normal  정규분포, 평균이 뮤, 표준편차가 시그마인 확률변수
Exponential 지수분포, 사건이 발생할 때까지의 경과 시간에 대한 연속확률분포
t-distribution t 분포 평균 0을 중심으로 좌우가 동일한 분포, 평균이 동일한지 알고자 할 때 검정통계량으로활용 
chi-square distribution 두 집단간 동질성 검정에 활용(ex. 관측값과 기대값의 차이)
모집단의 모분산에 대한 가설검정 
F- distribution 두 집단간 분산의 동일성 검정 자유도가 2개이다.
   

 

함수 종류

- pmf: Mass, 특정 포인트의 질량을 나타내는 함수

- pdf: Denstity, 특정 구간의 확률의 누적합을 나타내는 함수

- cdf: Cumulative density: x<a 인 구간의 확률의 누적합을 나타내는 함수  

+(번외) iid: independent and identically distributed

반응형