1. 단기 vs 장기 (Short term vs Long term) 데이터
1-1. Term의 의미
단기와 장기를 나누는 기준은 기간이 아니라 조건입니다.
조건에 따라 공정 능력을 평가한 데이터에 의해 단기와 장기 데이터로 나누어 집니다.
1-2. 예시
가. 5명의 학생들에게 수학문제를 풀게 해서 얼마나 많이 맞출 수 있는지 보고자 할 때
사람마다 맞추는 문제는 각각 다를겁니다. 한 학생은 1문제만 맞출 것이고 다른 학생은 전부 맞출 수도 있겠죠.
사람마다 다른 이유는 그 사람이 가지는 특성 때문입니다. 다 틀린 학생은 문과생이고 다 맞춘 학생은 이과생이겠죠
그런걸 "변수" 라고 합니다. 우리가 롤(LOL)을 할 때 아 이건 변수인데? 이건 변수다.. 할 때 그 변수가 맞습니다.
그리고 다음 날 이 5명의 학생들을 다시 불러서 이번에는 국어 문제를 풀게 합니다.
마찬가지로 "변수"에 특성에 따라 문제를 맞추는 사람은 제각각 나올겁니다.
나. 군내 변동 vs 군간 변동
위의 예시를 통해 우리는 군내 변동과 군간 변동을 이해할 수 있습니다.
먼저 5명의 학생들에게 수학문제를 풀게 할 때 얻어지는 데이터가 바로 군 입니다.
또한 변수 (문과생인지, 이과생인지)에 따라 데이터가 다르기 때문에 우리는 이것을 군내 변동이라고 부릅니다.
그런데, 다음 날 조건이 바뀝니다. 수학 문제를 풀게 했다가 국어 문제를 풀게 한 것이죠.
수학 문제를 풀었던 군이 이번에는 국어 문제를 풀었습니다. 이러한 변화를 군간 변동이라고 부릅니다.
동일 조건에서만 측정하는 데이터 (수학 문제만 풀게 하는 시험) - 군내 변동만 있는 데이터 : 단기 데이터 (Short term)
여러 조건을 변화하면서 측정하는 데이터 (수학 → 국어 → 과학 → 사회 문제) - 군내 변동과 군간 변동이 모두
반영된 데이터 : 장기 데이터 (Long term)
여기서, 수학 문제만 푸는 시험의 산포(표준편차)와 수학+국어+과학+사회 문제를 푼 시험의 산포를 비교하면,
당연히 후자의 산포가 더 크다고 볼 수 있습니다. 왜냐하면, 수학에는 자신이 있지만 국어는 자신없는 사람이 있겠고
반대로 국어는 자신있지만 수학은 자신없는 사람 등, 경우의 수가 매우 많기 때문이죠.
1-3. 정리
단기 데이터(군내 변동)로 공정 능력을 평가하게 되면 Cp, Cpk
장기 데이터(군내 변동 + 군간 변동)로 공정 능력을 평가하게 되면 Pp, Ppk
조건이 변화하는 장기 데이터가 동일 조건인 단기 데이터보다 산포가 크게 됩니다.
2. 마치며
Cpk, Ppk에 대한 개념은 3편에 이어서 하도록 하겠습니다.
'통계 이론' 카테고리의 다른 글
007. 시그마 (= σ, 표준편차) (0) | 2021.06.08 |
---|---|
006. 공정능력의 간단한 개념 (Cpk, Ppk) - 3차 (0) | 2021.06.08 |
004. 공정능력의 간단한 개념 - 1차 (0) | 2021.05.27 |
003. 검정, 교정, 보정이란? (0) | 2021.05.25 |
002. 척도의 종류에 따른 통계분석 방법 (0) | 2021.05.24 |