ABOUT ME

-

Today
-
Yesterday
-
Total
-
  • 표준화란? 표준화를 하는 2가지 이유
    카테고리 없음 2022. 9. 3. 01:57

    https://play.google.com/store/apps/details?id=com.clicker.smartnfast&hl=en-KR

     

    Auto Clicker - SmartNFast – Apps on Google Play

    Auto Clicker: Tap repeatedly, user-friendly, multiple points.

    play.google.com

    표준화란? 표준화를 하는 2가지 이유

    본문은 도서 내용의 일부임.

     

    정규분포 N(m, σ2)는 m, σ값에 의해 위치와 모양이 결정되는 정규분포곡선과 1대1 대응이 된다.

    m, σ두 값이 모두 다른 경우까지. m1 ≠ m2, σ1 ≠ σ2

    이처럼 m과 σ 둘 중 하나라도 값이 다른 경우 정규분포곡선은 겹쳐지지 않는다.

    그런데 표준정규분포라는 것이 있다. ‘표준’이라는 단어가 정규분포에 어떤 영향을 미치게 될까? 다음 그림을 보면 표준이 어떤 의미인지 알 수 있다.

    이건 마치 어떤 느낌이냐면 군대를 가는 것에 비유할 수 있다.

    입대 전에는 사람마다 제각각 다른 개성, 스타일로 살아가던 사람들이 입대하게 되면 군인스타일로 ‘표준화’되는 것이다.

    그렇다면 왜 정규분포를 표준화시킨 표준정규분포를 만드는 걸까?

    첫 번째 표준화를 하는 이유는 서로 다른 자료를 비교분석할 수 있다는 것이다.

    여기 한국인과 일본인 친구가 서울에서 만났다고 하자.

    두 사람 모두 회사를 다니고 있고 직급도 대리이다.

    한국인 A는 월급을 250만원을 받고 있고

    일본인 B는 30만엔을 받고 있다고 하자.

    A, B중 누가 더 자기나라에서 급여를 많이 받는 사람일까?

    국적도 다르고 ‘통화’도 다르지만 표준정규분포곡선에서 비교가 가능해진다.

    두 번째 표준화를 하는 이유는 확률 계산을 간편하게 하기 위해서이다.

    가령 어떤 학생의 국어점수가 85점이라고 하자. 전국 국어점수 평균은 70점, 표준편차는 5라고 하자. 이 학생이 상위 몇 퍼센트인지 알기 위해서는 N(70, 52)을 이용한 정규분포곡선상의 85점의 오른쪽 넓이(전체 넓이 1 중에서의 비율)를 알아야 한다.

    정규분포곡선의 전체 넓이는 1이며 빗금친 부분의 넓이를 알아야 85점의 정확한 위치를 알 수 있는 것이다. 이것을 산술로써 해결하려면 다음식을 계산해야 한다.

    먼저, 정규분포곡선의 함수식이 다음과 같다는 것을 공부한 바 있다.

    m= 70 , σ= 5 이므로

    위 정적분값을 구하기 위해서는 ‘미적분’을 공부해야 하며 자연상수 는 ‘미적분’라는 수학과정에서 다루어진다. 한마디로 계산하기 무척 어렵다는 것이다.

    따라서 계산을 간소화할 수 있는 표준화된 식이 필요해진다. 이 문제를 해결하기 위해 표준정규분포 N(0, 12)을 이용하는 것이다. 변량을 ‘표준화’라는 과정을 거치고 나면, 교재 뒷편에 있는 ‘표준정규분포표’를 보고 근사값을 찾으면 훨씬 계산이 간편해진다. 다시말해 어렵게 계산하지 말고 ‘표준화’를 거쳐 표에서 값을 찾자는 것이다.

    표준정규분포N(0, 12)로 적용시켜보니

    이 학생이 받은 85점보다 더 높은 점수를 받은 비율이 0.0013이므로 이 학생의 위치가 백분율 0.13%임을 알 수 있게 되었다.

    표준화를 통해 만들어진 숫자를 표준정규분포에서 찾아봄으로써 산술이 훨씬 간편해지고 빨라졌다.

    이제 ‘표준화’에 대해서 이야기 해보자. 표준화를 시키는 공식은 다음과 같다.

    다시 ‘편차’와 ‘표준편차’의 정의를 떠올려 보자. 편차=(변량−  평균)=X−  m이다. ‘표준편차’의 용어는 ‘표준’과 ‘편차’를 합친 말임을 볼 때 ‘모든 편차’를 표준으로 만든 하나의 숫자라는 것을 알 수 있다. 즉 편차들을 가지고 평균적인 값으로 만든 것이다. 먼저 분산을 아래와 같이 구한 다음,

    분산의 양의 제곱근이 ‘표준편차’인 것이다.

    그림으로 표현하면 아래와 같이 편차들을 모아서 하나의 평균적인 수로 만드는 느낌인 것이다. 표준편차를 구하는 과정에서 ‘분산’이라는 개념이 중간에 나오는 것이다.

    그렇다면 표준화는 ‘편차’와 ‘표준편차’ 2개의 값을 비율로 만드는 것이다.

    편차는 평균에서 얼마나 어떻게 떨어져있는지를 나타내는 수이므로 ‘편차’와 ‘표준편차’의 비를 알면 변량이 어느 위치에 존재하는지 알 수 있는 것이다.

    표준정규분포 N(0, 12)의 곡선을 보면 평균이 0이고 표준편차가 1로 고정되어 있으므로 변량를 표준화한 새로운 변량z이 가로축의 어디에 위치할지는 편차(X-m)와 표준편차 σ의 비

    이 결정한다. 주의할 것은

    에서 σ는 표준정규분포의 표준편차가 아닌 정규분포의 표준편차이다.

    X−  m= σ(편차=표준편차)이면

     

    이고 표준정규분포곡선에서 아래 정도에 위치하게 된다. 다시 말해 표준화란 '표준편차'와 '나의 편차'의 상대적인 비의 값이고, 따라서 어떤 정규분포이든 표준화가 가능한 것이다.

    본문은 도서 내용의 일부임.

    https://play.google.com/store/apps/details?id=com.clicker.smartnfast&hl=en-KR

     

    Auto Clicker - SmartNFast – Apps on Google Play

    Auto Clicker: Tap repeatedly, user-friendly, multiple points.

    play.google.com

     

    댓글

Designed by Tistory.