본문 바로가기

통계 이론

007. 시그마 (= σ, 표준편차)

1. 68-95-99.7 규칙

     정규분포를 나타내는 규칙으로, 평균에서 양쪽으로 3표준편차 범위에 거의 모든 값(99.7%)들이 들어간다는 것을 의미합니다. 

(출처: https://www.bartleby.com/questions-and-answers/areas-under-the-curve-for-any-normal-distribution-99.7percent-95.4percent-68.3percent-m-30-h-lo-lo-m/260e5ca3-a4ad-4c09-ac70-04afa872f8da)

     가. 약 68.3%의 값들이 평균에서 양쪽으로 1 표준편차 범위(μ±1σ)에 존재한다.

     나. 약 95.4%의 값들이 평균에서 양쪽으로 2 표준편차 범위(μ±2σ)에 존재한다.

     다. 거의 모든 값들(실제로는 99.7%)이 평균에서 양쪽으로 3표준편차 범위(μ±3σ)에 존재한다.

범위 차지하는 비율 범위를 벗어날 가능성(ppm)
μ±1σ 68.2689492137% 317,311
μ±2σ 95.4499736104% 45,500
μ±3σ 99.7300203937% 2,700
μ±4σ 99.9936657516% 63
μ±5σ 99.9999426697% 0.57
μ±6σ 99.9999998027% 0.002

 

2. 우연 변동, 이상 변동

   평균적으로 공정 능력은 공정 평균의 +3σ, -3σ정도로 봅니다.

   이 99.7% 안의 데이터 변동은 우연변동 (Random Variation)이라고 봅니다.

   하지만 99.7%에 벗어나는 즉, +3σ, -3σ를 벗어나는 수치는 이산 변동 (Assignable Variation)이라고 부르며

   공정에 이상이 발생했으므로 즉각적인 개선조치를 해야만 합니다.

   평균에서 좌우로 3σ 수준을 표준편차의 6배라고도 표현합니다.

 

3. 1.5σ Shift

     단기 데이터는 군내 변동만 존재하고, 군간 변동은 존재하지 않기 때문에, 장기 데이터보다 표준편차가 작습니다.

     1980년대 미국의 제조기업을 기준으로 분석한 결과 단기와 장기 시그마 수준이 약 1.5σ 정도의 차이가 발생하는 것을

     확인할 수 있었습니다. 그 이후, 보편적으로 산포를 볼 때, 장기 데이터의 경우에는 1.5σ를 더하여 불량률을 보게 됩니다.

     즉, z= 3σ 일 때 "군내 변동"으로만 고려한다면 2,700ppm의 불량률이 발생하지만 1.5σ를 Shift 시킨 값을

     표준정규분포표를 이용하면 약 66,807ppm(Z = 1.5)의 불량률이 발생합니다.

     즉, 군내 변동으로는 2,700ppm의 불량이 발생하지만, 다양한 조건들을 포함시켰을 때는 1.5σ (경험치)를 더해 66,807ppm의

     불량이 나올 것이다라고 예측하는 것입니다.

     또한 식스시그마 역시, 위 표에서처럼 단일 조건에서는 불량률이 0.002ppm으로 예상되지만, 

     다양한 조건들을 포함시킬 때는 1.5σ Shift하여 3.4ppm의 불량이 나올 것이다 라고 예측할 수 있습니다.