학습(공부)하는 블로그 :: '추측통계학' 태그의 글 목록
 

 

Notice»

Recent Post»

Recent Comment»

Recent Trackback»

03-29 00:00

 

'추측통계학'에 해당되는 글 1

  1. 2012.11.28 4. 숫자로 설명하기
 

4. 숫자로 설명하기

카테고리 없음 | 2012. 11. 28. 12:00 | Posted by 깨비형
반응형

1. 퍼센트 이야기 


1) 개념설명

① 퍼센트의 개념 

  누구나 알고 있는 퍼센트(%) 이야기 : 초등학교에서 "기준량을 100으로 보았을 때, 비교하는 양을 나타낸 수를 백분율 또는 퍼센트라고 하고 기호 %로 나타낸다"하고 배웠다.

  50에 대한 20의 퍼센트는 다음과 같다.



  '무엇에 대한' 퍼센트라고 표현할 때, 그 '무엇'이 언제나 기준이 되며 이 기준은 퍼센트를 계산할 때 분모가 된다.


- 퍼센트의 유용성 : 퍼센트는 2개 혹은 그 이상의 숫자의 상대적 크기를 명확하게 하기 위해 주로 사용된다.


- 퍼센트의 예 : A회사가 한 해 지출하는 비용이 3억2134만5000원인데 그 중에서 광고비가 3512만 3000원이라고 말하는 것보다 (전체 비용을 100으로 할 때) 광고비가 11%라고 표현하는 것이 전체 비용에 대한 광고비의 상대적인 크기를 더 쉽게 이해할 수 있도록 하는 방법이다. 




② 퍼센트의 기준

- 퍼센트를 혼동하는 이유 : 퍼센트에 많이 헷갈리는 이유는 퍼센트 기호(%)가 주는 수학적, 과학적, 논리적인 인상으로 퍼센트를 그대로 받아들이기 때문이다.



▲ 우리는 인형의 50%라는 말을 듣고 무의식적으로 인형갯수의 반이라고 생각한다. 계산된 퍼센트의 수치를 은연중에 받아들이고 그대로 가늠해 버리는 것이다.


- 퍼센트 혼동의 예 1

  어떤 상품의 가격이 100원에서 150원으로 올랐다고 할 때 인상률은 얼마일까? 인상률을 계산할 때는 원래 가격을 기준으로 퍼센트를 계산해야 한다. 왜냐하면 원래 가격보다 몇 퍼센트 올랐는가가 관심의 대상이기 때문이다.

  따라서 아래와 같이 계산하면 인상률은 50%가 된다.



  그러나 50%의 인상률은 소비자들에게 가격이 너무 많이 올랐다는 인상을 준다. 그렇다면 인상률을 낮추는 방법은 무엇일까? 그것은 바로 퍼센트를 계산하는 기준(분모)을 살짝 바꾸면 된다. 그러면 인상률은 33%로 낮아지게 된다. 

                   


- 퍼센트 혼동의 예 2

  만약 어느 회사의 사장이 다음과 같은 말을 했다면 그 말이 맞는 것일까?

  "종업원의 임금을 50% 인하하였더니 불평이 많아서 다시 50% 올려 원래대로 하였다." 이 말은 듣는 사람들에게는 임금이 원래의 임금으로 돌아간 것 같은 인상을 주  지만 실제로는 그렇지 않다. 100원의 월급에서 50%를 깎으면 50원이 되고 다시 50원의 월급에서 50%를 올려 주면 75원밖에 되지 않는다. 

  따라서 사장의 말은 틀린 것이며 50%의 인하를 상쇄하기 위해서는 100%를 인상  해야 원래의 임금으로 돌아가는 것이다. 



- 퍼센트를 따질 때 유의할 점 : 무엇에 대한 퍼센트인지, 기준이 제대로 적용되어 있는지를 항상 따져 보아야 한다.


③ 퍼센트가 계산된 실제 숫자의 중요성

- 사례 : 치안 예산을 올리고 싶은 어느 시골마을의 경찰 관리는 살인사건이 지난 한 해 동안 67% 증가했다고 근거를 댑니다. 살인사건이 67%나 증가했다면 그 마을에 강력범죄가 극성을 부리는 것 같지만 실제로는 살인사건이 3건에서 5건으로 증가한 것 뿐 일수도 있다. 퍼센트를 대할 때는 퍼센트가 계산된 실제숫자를 알려고 해야 한다. 

            


④ 잘못된 사례

- 미국의 실제 사례 : 미국에는 3000여개의 대학이 있는 데 거의 모든 대학이 남녀공학이다. 20~30년 전부터 남자 혹은 여자대학이 성차별을 금지하는 추세에 따라 남녀공학으로 바꾸어 왔다. 전통이 오래된 남자대학에서는 동창회를 중심으로 여성의 입학을 강하게 반대했다. 볼티모어에 있는 존스 홉킨스(Johns Hopkins)대학에서도 논란 끝에 여성 입학을 허용했는 데 반대하는 쪽에서는 여학생의 33.3%가 교수와 결혼을 했다고 그 단점을 강조했다. 여학생의 33.3%가 교수와 결혼을 했다면 대단한 뉴스 같지만 실제로는 처음으로 입학한 세 명의 여학생 중 한 명이 교수와 결혼한 것이었다.


2) 세상에서 가장 신비로운 수


 세상에서 가장 신비한 수는 142857 이다.  평범해 보이는 이 수가 왜 그렇게 신비한 걸까?? 


 1.142857에 1부터 6까지 차례로 곱해보자. 숫자가 나오는 순서가 같다.

 2. 그러면 142857 에 7을 곱하면 얼마일까? 답은 놀랍게도 999999 이다. 

 3. 마지막으로 142857 을 제곱하면? 142857 을 제곱하면 20408122449 라는 수가 나오는데

    다섯 자리씩 나누어 더하면 20408 + 122449 = 142857 이 된다.

 ※ 1/7을 소수로 변환하면 0.142857이 무한 반복된다. 여기서 142857의 수가 나왔다.

              

※ 쉬어가기   

 "세상에는 세가지 거짓말이 있다.
 거짓말, 새빨간 거짓말, 그리고 통계 이다
"

 통계의 속성을 비꼬는 말로 자주 거론되는 명언이다.

 사람들은 정확한 자료인 것처럼 그럴듯한 통계수치를 제시하면 확인해보지도 않고 믿어버리는 경향이 있다. 때문에 우리는 통계에 대한 기본적인 지식이 필요하다.



2. 자료의 특성 


1) 통계학이란?

① 통계학의 분류



- 기술통계학과 추측통계학으로 나뉜다.

- 기술통계학은 주어진 자료의 여러 특성을 수치로 나타내는 방법으로 평균, 분산 등이 여기에 속하며 주로 사회통계, 경제통계에 응용된다.(KTX 연간이용인원, 연평균 증가율)

- 추측통계학은 주어진 자료로부터 미래의 불확실한 상황을 예측, 추론하는 것으로 모집단, 표본 등이 있으며 사회조사, 시장조사, 여론조사 등에 응용된다.(2011년 수도권 인구비중이 50.1%라는 자료)

- 일반적으로 기술통계학은 추측통계학의 전 단계 분석이다. 


2) 개념설명


① 평균

- 평균이란 : 산술평균으로 측정된 값들의 합을 측정 개수로 나눈 값으로 우리가 일상생활에서 가장 많이 사용 평균은 쉽게 계산/이해되는 장점이 있는 반면 극단적인 값에 영향을 받는다.

- 평균의 예 1

  A우체국 월 평균 민원접수건수 8, 6, 4, 7, 6, 5을 모두 더하면 36, 6으로 나누면 월평균 6건이고 B우체국은 6, 4, 1, 5, 18, 2를 모두 더하고 6으로 나누면 월평균 6건으로 두 우체국의 월평균 민원접수 건수는 똑같다.

  만약 두 우체국에 월평균 민원접수 건수를 5건 이하로 줄이라는 목표가 떨어졌다면 A우체국과 B우체국이 같은 방법으로 문제를 해결할까?

  아마도 B우체국이라면 5월에 왜 18건의 민원이 접수되었는지 분석해보고 문제점을 파악하려 할 것이다. 이렇게 특이하게 다른 자료를 보통 이상치라고 한다.



- 평균의 예 2

  A국가와 B국가 모두 평균 국민소득은 똑같이 2만불인데 A국가는 평균 2만불 소득의 중산층이 많고 극빈층과 고소득층이 적어서 안정된 종모양을 이루고 있으나 B국가는 빈부의 격차가 심해 중산층이 적고 평균소득이하의 저소득층과 극빈층이 많아 종모양이 아니다. 두 나라의 평균은 같지만 실제 자료의 분포는 이렇게 판이하게 다를 수 있다. 이렇듯 평균은 자료에 이상치가 있는지 자료가 종모양의 분포인지 꼭 확인해야 한다.


            

                             ▲ A나라 국민소득                        ▲ B나라 국민소득


② 중앙값

- 중앙값이란 : 측정된 값들을 크기 순서대로 정렬했을 때 중앙에 위치하는 값으로 측정된 개수가 짝수개이면 중앙 두 개 값의 평균으로 구한다.

- 중앙값의 장.단점 : 극단적인 값에 대해 왜곡되지 않는 장점이 있지만 수학적 특성이 결여되는 단점이 있다.


③ 최빈값

- 최빈값이란 : 측정된 값들에서 가장 많이 나타나는 즉 빈도가 가장 많은 값을 말한다.

- 최빈값의 예 

  A우체국의 최빈값은 6이고 B우체국은 모두 1번씩만 나타나므로 최빈값이 없다.



- 평균, 중앙값, 최빈값의 일치하는 경우 : 학급에서의 영어성적, 몸무게, 키 등과 같이 대부분 좌우대칭의 종모양으로 이루어 질 때 평균, 중앙값, 최빈값은 일치한다.

- 평균, 중앙값, 최빈값의 일치하지 않는 경우 : 야구선수들의 연봉과 같이 고액연봉을 받는 몇몇의 스타급 선수와 준 스타급 선수, 그리고 대부분의 일반 선수들로 구성된 분포는 종모양의 분포를 이루지 않기 때문에 평균, 중앙값, 최빈값이 일치하지 않는다.


④ 잘못된 사례

- 신문기사

   어느 신문에서 음주운전에 대한 다음과 같은 보도를 하였다.
  "주말의 음주 증가 때문에 치명적인 사고 중 42%가 금요일, 토요일, 일요일에 발생하였다.”이 기사에 대해서 어떤 생각을 하는가? 이 3일 동안에 치명적인 사고의 42%가 발생했다는 것이 놀라운 사실인가? 하지만 금요일 토요일 일요일이 일주일(월, 화, 수, 목, 금, 토, 일)의 몇 %를 차지하는지 계산해 보면 42.8%를 차지하고 있다. 이 기사는 기사거리  라고 볼 수 없는 것이다.



3. 내용정리


 
  • 통계학에는 (기술통계학)과 (추측통계학)이 있다. 
  • (평균)은 산술평균으로 측정된 값들의 합을 측정 개수로 나눈 값이다
  • (중앙값)은 측정된 값들을 크기 순서대로 정렬했을 때 중앙에 위치하는 값이다.
  • (최빈값)은 측정된 값들에서 가장 많이 나타나는 즉 빈도가 가장 많은 값을 말한다.





반응형
: