🧠 공부/통계학
[ADP 2과목] 통계분석의 이해
소리331
2024. 7. 13. 23:17
반응형
통계자료를 획득하는 방법
총조사/ 전수조사 | |
표본조사 | Simple Random Sampling: 단순랜덤 추출법, 임의의 n 개 추출 |
Systematic Sampling: 계통 추출법 k번째마다 하나씩 뽑는 방법( k, 2k, 3k, ... ) | |
Cluster Random Sampling: 집락추출법: cluster를 구성해서 군집마다 하나씩 ( ex, 지역별 n명) | |
Stratified Random Sampling: 층화추출법:계층에서 뽑는 방법 |
척도
명목척도 | 어느 집단에 속하는지 카테고리 분류할 때 |
순서척도 | 대상의 서열과 순서를 측정할 때 |
구간척도 | 구간사이의 간격이 의미 있을 때 |
비율척도 | 간격에 대한 비율이 의미가 있는 자료 (절대적 기준인 0이 존재, 사칙연산 가능) |
확률 분포
이산형 - 확률질량함수(pmf - mass)
베르누이 확률 분포 | 결과가 2개일때(1회) |
이항분포 | 베르누이를 n 회 실행 |
기하분포 | 베르누이 시행에서 첫번째 성공이 있을 때까지 x 번 실패할 확률 |
다항분포 | 이항분포의 확대 |
포아송분포 | 시공간에서 발생하는 사건의 발생횟수에 대한 확률분포 |
연속형 - 확률밀도함수(pdf - density)
Uniform | 균일분포, 모든 구간이 동일 |
Normal | 정규분포, 평균이 뮤, 표준편차가 시그마인 확률변수 |
Exponential | 지수분포, 사건이 발생할 때까지의 경과 시간에 대한 연속확률분포 |
t-distribution | t 분포 평균 0을 중심으로 좌우가 동일한 분포, 평균이 동일한지 알고자 할 때 검정통계량으로활용 |
chi-square distribution | 두 집단간 동질성 검정에 활용(ex. 관측값과 기대값의 차이) 모집단의 모분산에 대한 가설검정 |
F- distribution | 두 집단간 분산의 동일성 검정 자유도가 2개이다. |
함수 종류
- pmf: Mass, 특정 포인트의 질량을 나타내는 함수
- pdf: Denstity, 특정 구간의 확률의 누적합을 나타내는 함수
- cdf: Cumulative density: x<a 인 구간의 확률의 누적합을 나타내는 함수
+(번외) iid: independent and identically distributed
반응형