본문 바로가기
공정관리/6시그마

[6시그마] 기초통계

by spectrum20 2022. 11. 19.

통계학

필요한 자료및정보를 최적의 방법으로 수집하고, 수집한 자료를 과학적이고 논리적인 이론에 의해 정리 분석하는 학문

 

- 기술통계학

: 자료에서 합계나 평균 등 필요한 정보를 계산하고, 그래프를 이용하여 자료를 수집, 정리, 요약하는 이론과 방법

- 추론통계학

: 표본자료에서 얻은 정보를 이용하여 모집단에 대한 정보를 예측하는 이론과 방법

 

 

* 표본 : 모집단의 일부

* 모집단 : 관심있는 전체 집단

* 통계량 : 표본의 특성을 나타내는 값 

* 모수 : 모집단의 특성을 나타내는 값

 

 

측정 척도와 데이터의 유형

측정척도

- 명목척도 : 측정 대상의 고유한 특성에 따라 분류할 목적으로, 동일한 특성을 갖는 대상들을 구분하는 척도

                   ex) 색깔, 남/여, 재료1/재료2/재료3

- 순위척도 : 측정 대상들의 특성과 다과 또는 대소의 서열에 따라 구분하는 척도

                   ex) 설문조사 만족도 5점 척도, 얼룩 수준

- 구간척도 : 속성의 양적인 정도를 등간격으로 구분하여 수치를 부여한 척도

                   ex) 온도, 종합주가지수

- 비율척도 : 구간척도와 동일하지만, 절대적인 원점과 비율계산이 가능한 척도

                   ex) 시간, 길이, 무게

데이터 

- 연속형 데이터 : 연속적으로 측정되는 정량적/계량적 데이터

                            ex) 온도, 무게

- 이산형 데이터 : 측정된 데이터의 숫자를 세어서 얻은 데이터

                           ex) 불량률, 인원수

 

 

 

기술통계학

자료에서 합계나 평균 등 필요한 정보를 계산하고, 그래프를 이용하여 자료를 수집, 정리, 요약하는 이론과 방법

 

대표값

- 데이터의 중심

(산술) 평균 모든 관측된 데이터의 합을 관측된 횟수로 나누어준 값
이상치 데이터에 절대적인 영향을 받음
중앙값 관측된 데이터를 크기 순으로 정렬하였을 때, 가운데 위치한 값
(n+1)/2
최빈값 관측된 데이터 중에 빈도수가 가장 많은 값

- 데이터의 산포

편차 개개의 측정치와 평균간의 거리의 차
분산 편차 제곱의 합
표준편차 분산의 제곱근
범위 최대값에서 최소값을 뺀 값
사분위수 데이터를 순서대로 나열하여 1/4과 그 배수가 되는 값
사분위 범위 = 3/4 분위수  - 1/4 분위수
변동계수 품질특성마다 척도가 다르고, 그에따른 표준편차의 척도도 달라지므로 이를 고려하기 위해 해당 품질특성의 평균으로 나눠서 품질 특성간 비교가 가능토록 하기 위한 값
CV = S/X

 

그래프

- 히스토그램 (histogram) : 데이터의 중심과 산포를 대략적으로 파악

- 상자그림 (box plot) : 데이터의 중심과 산포 형태, 이상치의 존재 여부 파악

 

 

추론통계학

 

모집단과 표본

- 모집단(statistics) : 우리의 관심대상이 되는 전체 집단

- 표본(sample) : 모집단에서 조사대상으로 선택된 일부

- 모수(parameter) : 모집단의 특성을 나타내는 수

- 통계량(statistics) : 표본의 특성을 나타내는 수

 

표본 오차

편향된 표본의 오류로 모집단에 대한 결론을 이끌어 내는데 사용된 표본이 편향됨

좋은 표본이란 모집단의 관심사항을 비슷하게 표현하는 표본

 

표본추출

층화임의추출법 (Stratified Random Sampling)

모집단이 서로 이질적인 원소들로 구성되어 있을 때, 이들을 서로 겹치지 않는 동질적인 그룹 층들로 구분하고, 각 층에서 무작위로 추출하여 표본을 추출하는 방법

 

추정

점추정 : 표본에서 얻어지는 정보를 이용하여 알지 못하는 모수의 참값을 하나의 추측된 값으로 나타내는 것

구간추정 : 모수를 하나의 값으로 추정하는 것이 아니라 구간으로 나타내는 것

 

 

 

반응형

댓글