-
일상생활에서 흔하게 마주치는 통계적 추정의 예시확률과통계 2022. 9. 3. 02:00
https://play.google.com/store/apps/details?id=com.clicker.smartnfast&hl=en-KR
일상생활에서 흔하게 마주치는 통계적 추정의 예시
많은 사람들이 자신의 경험에 빗대어 어떤 사실에 대해 ‘대부분’이라든지 ‘거의 전부야’라는 판단을 한다. 하지만 대부분의 사람들은 자신 주변에 2명 내지는 3명 정도의 표본을 보고서 ‘일반화’시키거나 ‘확대’해석하는 것에 불과하다. 왜냐하면 지구 상의 인구가 60억이고 대한민국의 인구가 5000만인데 대부분 그렇다고 말하려면 적어도 50억명이나 4000만명 정도를 조사해야 ‘대부분’이나 ‘거의’라는 말을 쓸 수 있을 것이다. 이것은 현실적으로 불가능하다. 그럼에도 불구하고 저렇게 이야기하는 것이 전혀 틀렸다고 말할 수 없을 것이다. 비록 일부일지라도 전체로서 ‘일반화’시킬 수 있는 여지가 있기 때문이다. 우리는 그것을 ‘추정’이라고 부른다.
가령 반장 선거를 한다고 가정해보자. 40명의 학생이 각각 A와 B 두 사람의 후보 중 한 명에게 투표를 하였고 그 결과를 알기 위해 용지를 개표한다고 하자. 우리의 경험상 모든 투표용지를 확인하지 않아도 도중에 결과를 ‘추정’할 수 있다.
총 40명의 학생 중에 7명의 일부 결과를 보아도 그 전체 결과를 ‘추정’할 수 있다.(선출 결과라는 동일한 특성) 이때 40명의 학생집단을 ‘모집단’이라 부르고, 7명의 학생집단을 ‘표본’이라고 부른다. 7명은 표본의 크기라고 부른다. 물론 반드시 A가 당선된다는 보장은 없다. 어디까지나 가능성이 높다는 것으로서 추정할 뿐이다. 그렇지만 매우 높은 확률로 A가 당선될 것이라는 것을 ‘추정’할 수 있는 것이다.
또 일상생활에서 추정을 살펴보자. 길을 걷다가 귀걸이를 떨어뜨렸다고 생각해보자. 그럴 때 귀걸이가 어디에 있을 것이라고 추정하는가? 떨어뜨린 발 근처에서 찾거나 귀걸이가 만약 둥글게 생겼다면 조금 더 멀리까지 추정할 것이다. 나의 위치에서 1m이내에 있을 것으로 본다면 신뢰도가 90%는 될 것이라고 생각하는 것과 같다. 신뢰도를 100%로 한다면 어느 범위로 늘리면 좋을까? 내가 귀걸이를 떨어뜨린 지역이 OO동이라고 한다면 그 동안에 귀걸이가 포함될 확률은 거의 100%일 것이다.
또 다른 일상생활의 예시는 해수욕장이다. 바닷물이 얼마나 짠지 한 번만 먹어보면 알 수 있는데, 수영을 하다가 맛본 바닷물이 만약 바나나나 딸기맛이 났다면 '아 바닷물은 딸기맛이 나는구나'라고 일반화할 수도 있었을 것이다. 하지만 만약 그런 사람이 있다면 그건 어떠한 계기로 딸기맛이 나는 특정한 구간의 물을 맛본 거라고 우리는 알 수 있다. 사실은 우리가 먹은 바닷물은 겨우 한 모금에 불과한데, 지구 전체의 바닷물이 짜다는 것, 즉 농도를 '추정'한 것이다.
이처럼 우리들의 경험의 양은 한정되어 있어 있지만 그것을 가지고서 그럴싸한 판단을 내려야 하는 상황이 많다. 정당 지지율을 조사하거나 대통령 국정운영 지지율도 모든 국민을 대상으로 조사를 할 수 없다.
특히 ‘표본’의 평균을 가지고서 ‘모집단’의 평균을 추정하는 것을 ‘모평균 추정’이라고 부른다.
https://play.google.com/store/apps/details?id=com.clicker.smartnfast&hl=en-KR
'확률과통계' 카테고리의 다른 글
확률변수 -> 확률분포표 만드는 방법 (0) 2022.09.01 야구 경기 문제로 살펴보는 독립시행확률 (0) 2022.09.01 독립시행확률 : 동전을 100번 던져도 앞면이 나올 확률이 1/2로 똑같은 이유 (0) 2022.09.01 조합으로 설명되는 로또 100% 당첨되는 방법 (0) 2022.09.01 이항정리가 파스칼삼각형의 한계를 극복? (0) 2022.09.01