본문 바로가기
공정관리/6시그마

[6시그마] 기초통계, 통계 분석

by spectrum20 2022. 5. 7.

데이터의 개념 이해

1. Data

- 연속형(계량형) 데이터 : 측정값, 소수점 O, 소수, 모든 구간의 값 표현 가능

                                 평군, 분산, 표준편차

- 이산형(계수형) 데이터 : count, 소수점 X, 정수, 특정 구간의 값만 표현 가능

                                 빈도, 비율 

2. 모집단과 표본

  모집단 표본
정의 모든 관측값들의 집합 모집단의 일부분
평균 μ (뮤)
표준편차  σ (시그마)
분산  σ² (시그마 제곱)
비율 P (피)

 

6시그마 주요 통계분석

0. 가설 검정

- 귀무가설 (H0) : 어떤 현상이 변화가 없거나, 개선이 안되었다는 가설 (기존의 사실, =)

- 대립가설 (H1) : 어떤 형상에 변화가 있거나, 개선이 되었다는 가설 (새로운 사실, ≠)

 

- α (유의수준) : 가설을 선택하는 기준 (보통 5%)

- P-value (유의확률) : 귀무가설을 기각했을 때, 오류가 발생할 확률

ex) 유의수준을 0.05 로 설정했을 때,

  P ≥ 0.05(α) : H0 채택, H1 기각

  P < 0.05(α) : H1 채택, H0 기각

 

1. 정규성 검정

: 통계적 가설검정을 수행하는 과정에서 분석에 쓰이는 연속형 자료가 정규분포를 따르는지를 알아보는 검정

 

- 중심극한정리 : 표본의 수가 30개를 넘게 되면 자료의 분포가 정규분포에 근사

- 모집단이 정규분포를 따를 때, 표본이 정규분포를 따르면 표본을 신뢰할 수 있음

 

2. 등분산 검정

: 두 모집단의 평균값을 비교할 경우, 먼저 분산에 통계적 차이가 존재하는지 검정하여야 함

 두 모집단간 분산이 같은지 판별

 

- 검정 Tool

정규분포를 따를 때 → F 검정

정규분포를 따르지 않을 때 → Levene 검정

  등분산 이분산
가설 귀무가설(H0)
두 집단의 분산은 같다
대립가설(H1)
두 집단의 분산은 다르다
P-value (P 값) 0.05 이상 0.05 미만
그래프

 

3. t-검정

: 두 모집단의 산포를 모를 때, 평균이 같은지 판별

 

- t검정 전 정규성 검정을 통해 정규성을 따르는지 판별 후, 등분산 검정을 통해 등분산을 가지는지 확인

- 가설

  귀무가설(H0) : 두 집단의 평균은 같다

  대립가설(H1) : 두 집단의 평균은 다르다

 

4. 쌍체 t-검정

: 쌍 데이터 평균 비교

 

- 독립적이지 않은 확률 표본을 비교할 때, 사용

- 표본의 크기가 큰 경우에는 모집단의 분포가 정규분포라는 가정이 없어도 근사적으로 검정 가능

- 가설 

  귀무가설(H0) : 두 집단의 평균은 같다

  대립가설(H1) : 두 집단의 평균은 다르다

 

5. 분산분석 (ANOVA)

: 특성치의 산포를 제곱합으로 나타내고 이 제곱합을 요인마다 제곱합으로 분해하여 오차에 비해 특히 큰 영향을 주는 요인이 무엇인지 찾아내는 분석방법 (3개 이상의 집단에서 평균치가 같은지 판별)

→ 분산을 통해서 평균을 비교

 

- 가설

  귀무가설(H0) : 집단간의 평균의 차이는 없다.

  대립가설(H1) : 적어도 하나의 평균은 다른 하나의 평균과 다르다

 

6. 상관분석

: 두 변수 사이에 존재하는 상호 관련성이 간접적인 선형관계인지, 직접적인 선형관계인지 결정하는데 사용

 

- 상관계수가 -1에 가까울수록 강한 음의 상관

- 상관계수가 1에 가까울수록 강한 양의 상관

- 상관계수가 0에 가까울수록 두 변수간 관계 없음

 

7. 두 비율 검정

: 이산형 데이터에서 두 집단 이하 간의 비율이 같은지 판별

 

- 가설

귀무가설(H0) : 두 집단의 비율은 같다

대립가설(H1) : 두 집단의 비율은 다르다

 

8. 카이제곱 (Chi-square) 검정

: 이산형 데이터에서 두 집단 이상 간의 비율이 같은지 판별

 

- 가설

귀무가설(H0) : 두 집단 이상 간의 비율은 같다

대립가설(H1) : 두 집단 이하 간의 비율은 다르다

반응형

댓글