-
정규분포곡선의 함수식을 분석해야 하는 이유카테고리 없음 2022. 9. 3. 01:55
https://play.google.com/store/apps/details?id=com.clicker.smartnfast&hl=en-KR
정규분포곡선의 함수식을 분석해야 하는 이유
이 곡선의 좌우 위치(⇔)는 m의 값에 따르고, 상하(⇕) 모양은 σ의 값에 따른다.
기본적으로 정규분포곡선은 다음과 같은 특징을 가진다.
① 종 모양이다.
② 가운데를 기준으로 좌우 대칭이다.
③ 아랫부분의 넓이는 1이다.
σ는 일정하고, m만 다른 세 개의 정규분포식 N(m1, σ2), N(m2, σ2), N(m3, σ2)이 있다고 하자.
m1< m2< m3
σ는 모양을 결정하므로 세 정규분포 곡선은 모양이 같다.
σ는 같으므로 종모양이 같다.
① m값이 클수록 곡선이 오른쪽에 위치한다.
② m(평균)은 종모양의 한 가운데 값이다.
이번에는 m은 고정시키고, a값을 다르게 해보자.
σ1< σ2< σ3
m은 같으므로 가운데의 위치가 같다.
① σ 값은 종모양을 결정한다.
② σ 값이 작으면 평균에 가까운 값이 몰려있다는 것이므로 우뚝 솟은 모양이 된다.
표준편차가 작을수록 가운데가 높게 우뚝 솟은 모양임을 알 수 있다. 왜 그런지 생각해보면 당연한 결과임을 알 수 있다.
표준편차가 작은 것은 분산(
)이 작다는 것을 뜻한다. 분산은 흩어진 정도를 뜻한다. 그렇다면 ‘무엇으로부터’ 흩어진 것인지 기준이 필요한데 통계에서 말하는 ‘무엇으로부터’란 ‘평균’을 말한다. 그렇다면 분산이 작다는 것?은 평균으로부터 흩어진 정도가 작다는 것이고 결국 평균으로부터 자료들이 가까이 있다는 것을 말한다. 반대로 분산이 크다는 것은 흩어진 정도가 크다는 것이고 결국 평균으로부터 멀리 떨어진 자료가 많다는 것이다.
①번이 분산이 작은 그림이다.
분산(σ2)이 작다→(평균으로부터) 흩어진 정도가 작다→평균에 자료가 몰려있다.
분산(σ2)이 크다→(평균으로부터) 흩어진 정도가 크다→평균에 자료가 몰려있지 않다.
이것이 정규분포식 N(m, σ2)에서 m과 σ2이 가지는 의미이다. 이 두 개의 값이 문제해결에 있어 전부라고 해도 과언이 아니다. 또한 분산σ2의 양의 제곱근인 표준편차(σ)도 마찬가지로 해석할 수 있다.
꽤 복잡해 보이는 위 함수식을 암기할 필요는 없다. 다만 함수식에 포함된 m과 σ가 어디에 위치하고 왜 m이 좌우이동에 영향을 주고 σ가 가운데 높이에 영향을 주는지를 암기하는 것이 아니라 이해해보는 것이다.
당연한 이야기지만 함수값이 크면 위쪽에 그려지고 작으면 아래에 그려진다.
첫 번째는 이 식의 ‘x에 얼마를 대입할 때, f(x)는 최댓값을 가질까?’이다.
(=곡선이 가장 높은 지점에서 x값이 무엇일까?)
가장 먼저
는 양수이다. 이와 곱의 관계에 있는
의 값이 클수록 함수값f(x)의 값도 커진다.
를 살펴보면, x는 e의 지수인
의 분자에 있다.
e는 무리수로서 약 2.8이므로 1보다 큰 밑이다. 즉, e의 지수인
의 값이 클수록 함수f(x)값 이 크다. (x− m)2≥ 0이고 σ2≥ 0이므로
이고
의 최대값이 0임을 알 수 있다.
따라서 x = m일 때 f(x)가 최댓값을 가진다.
두 번째 ‘표준편차가 작으면 왜 가운데 부분이 솟을까?’이다. 이것도 암기가 아니라 함수식을 통해 자연스럽게 그렇게 됨을 이해하는 것이 필요하다.
가운데 부분이 솟아 있고, 이때의 함수값이라는 것은 x=m일 때의 함수값이다. 따라서 x=m인 경우를 기본전제로 하고난 표준편차와 최대값 f(m)의 관계를 살펴봐야 한다.
x=m인 경우 (x− m)2= 0이므로
이다.
즉, x=m일때,
최대값이
인데 표준편차 σ가 분모자리에 있으므로 최댓값(종모양의 가운데 높이)과 표준편차는 반비례관계에 있는 것이다.
이로써 평균(m)과 표준편차(σ)가 정규분포곡선에서 하는 역할과 그 이유를 알 수 있게 되었다.
https://play.google.com/store/apps/details?id=com.clicker.smartnfast&hl=en-KR