[하운의 R공부] 5일차 - 20% 불수능과 물수능
다음은 최근 수능의 수리(수학)과목 가형의 2년단위 등급컷 입니다.
불수능으로 유명했던 2011수능은 1등급 등급컷은 79점 이지만, 반대로 물수능으로 유명한 2015수능의 등급컷은 만점입니다.
그렇다면 여기서, 2011년의 80점과 2015년의 100점중 누가 더 나은 결과를 얻을 걸까요?
단순히 점수로만 비교하는건 불합리해 보입니다. 그래서 도입된 지표가 바로 표준점수입니다. 표준점수란 평균점수와 표준평균을 이용해 학생들의 원점수와 '표준화' 시킨 점수입니다.
*표준화란? 수치간 정확한 비교를 위해 단위를 삭제하고 상대적 수치로 나타내는 과정
표준화를 위해선 중심화와 척도화과정이 필요합니다.
이 친구들의 점수를 표준화 시켜볼까요?
중심화란? 관측치에서 평균을 빼는 과정입니다. 즉, 평균에서 얼마나 멀리 떨어져 있는가 입니다.
척도화란? 각 관측치를 표준편차로 나누는 것입니다. 이를 통해 단위를 삭제하고, 수치간 객관적 비교가 가능하게 됩니다.
표준점수는 이렇게 나온 표준화 값에 20을 곱하고 100을 더해 계산합니다.
2011수능의 80점의 표준점수는 133점(100+1.63*20 = 132.6)이고
2015수능의 100점의 표준점수는 131점(100+1.56*20 = 131.2)이 됩니다.
표준점수 상으론 2011년의 80점이 더 나은 성적이라고 말하고 있네요!
이처럼 표준화를 통해 우리는 다른 평균을 가진 값들을 가지고 비교를 할 수 있게 됩니다.
(2015년도에 100점을 받은 학생이, 100점 이상의 실력을 가졌을 가능성은 배제하겠습니다.)
PART 1 차이를 확인하는 데이터 요약
1% 줌아웃
5% 날줄과 씨줄
데이터의 구성|데이터와 데이터 공간|알파벳을 활용한 예제 데이터의 표현|기술 통계량과 변수 요약
10% 순서대로 한줄서기
정렬과 순서 통계량|분위수|사분위수와 다섯 숫자 요약|상자그림|히스토그램
15% 더치페이와 N빵
평균|분산|표준편차
20% 물수능과 불수능
표준화|표준화?예제
25% 먹고 싶은 거 먹어, 난 짜장
동전 던지기|파이 차트와 막대그래프
30% 0.000012%의 꿈, 로또
확률|확률을 활용한 당첨 번호 예측|데이터 분석과 확률
PART 2차이를 설명하는 통계 개념
31% 범인은 이 안에 있다
35% 부전자전, 유전 연결고리
산점도|상관관계|상관계수
40% 니가 하면 나도 한다
교차표|행 백분율과 열 백분율|열지도|독립
45% 최저가, 알고 보니 옵션가
조건부 확률과 조건부 평균|심슨의 역설
50% 아낌없이 주는 의사결정나무
모자이크 그림|의사결정나무 모형
55% 점심 뭐 먹지?
ABCDEF 테스트|분산과 분산분석
PART 3차이를 예측하는 통계 모형
56% 우연과 운명 사이
60% 지구는 우주의 티끌
표본과 모집단|통계량과 분포|자연스러운 확률
65% 웬만해선 이길 수 없다
유의수준|필요악과 같은 분포|키의 히스토그램과 정규분포
70% 남자 평균 174.9cm, 여자 평균 162.3cm
표본평균의 표준편차|표본평균의 표준편차 계산| t -값과t -분포 t -분포|p -값과t -테스트
75% 관계 검증을 위한 테스트
t -검정의 활용|카이제곱분포를 활용한 독립성검정 F -분포를 활용한 분산분석
80% 아빠 키 유전 확률, 25%
다시 한번 상관계수|선형회귀모형|부모 맘 같지 않은 자식
PART 4데이터 분석 도구, R
81% 그것이 R고 싶다
85% R 시작하기
R 설치|RStudio 설치|RStudio의 실행
90% 순서대로 살펴보는 BR31
95% R로 분석 다시 보기
하나의 연속형 변수를 요약하기|하나의 범주형 변수를 요약하기|두 개의 범주형 변수의 관계 찾기|두 개의 연속형 변수의 관계 찾기|차이를 설명하는 간단한 통계 모형 살펴보기
0% 대학만 가면 끝일 줄 알았는데
찾아보기