개발의 여름
2018. 2. 6. 01:18
2018. 2. 6. 01:18
치킨 뜯고 공부하자 100일 프로젝트 대망의 첫날
머릿말
part1
머릿말. 데이터 분석을 배우기 위해서 우리는 어디서부터 시작해야 할까요?
- 아무리 복장합 데이터 분석도 목적과 과정을 살펴보면 어떤 차이를 확인하고 설명하려 합니다.
- 통계학은 차이를 수학이라는 도구로 풀어냅니다.
프롤로그
- 문법보다 회화
- 차이를 이하해기 위한 통계
- 진짜 목표는 데이터 속에 있는 차이는 확인하고 설명하는 것.
- 불확실성을 설명하는 통계
- 과거와 현재, 미래가 소통하는 언어
목차
PART 1 차이를 확인하는 데이터 요약
- 줌아웃
- 날줄과 씨줄
- 데이터의 구성, 데이터와 데이터 공간
- 알파벳을 활용한 예제 데이터의 표현, 기술 통계량과 변수 요약
- 순서대로 한줄서기
- 정렬과 순서 통계량, 분위수, 사분위수와 다섯 숫자 요약, 상자그림, 히스토그램
- 더치페이와 N빵
- 물수능과 불수능
- 먹고 싶은거 먹어, 난짜장
- 0.000012%의 꿈, 로또
- 확률, 확률을 활용한 당첨 번호 예측, 데이터 분석과 확률
PART 2 차이를 설명하는 통계 개념
- 범인은 이 안에 있다.
- 부전자전, 유전 연결고리
- 40% 니가 하면 나도한다.
- 교차표, 행, 백분율과 열 백분율, 열지도, 독립
- 최저가, 알고 보니 옵션가
- 아낌없이 주는 의사결정 나무
- 점심 뭐 먹지?
PART 3 차이를 예측하는 통계 모형
- 우연과 운명 사이
- 지구는 우주의 티끌
- 표본과 모집단 통계량과 분포, 자연스러운 확률
- 웬만해선 이길 수 없다.
- 유의수준, 필요학과 같은 분포, 키의 히스토그램 정규분포
- 남자평균 174.9cm, 여자평균 162.3cm
- 표본평균의 표준편차, 표본평균의 표준편차 계산, t-값과 t-분포
- t-분포, p-값과 t-테스트
- 관계 검증을 위한 테스트
- t-검정을 활용, 카이제곱분포를 활용한 독립성검정
- F-분포를 활용한 분산분석
- 아빠 키유전 확률, 25%
- 다시 한번 상관계수, 선형회귀모형, 부모 맘 같지 않은 자식
PART 4 데이터 분석 도구, R
- 그것이 R고싶다.
- R 시작하기
- R설치, R Studio 설치, R Studio 실행
- 순서대로 살펴보는 BR31
- R로 분석 다시 보기
- 하나의 연속형 변수를 요약하기, 하나의 변주형 변수를 요약하기
- 두 개의 범주형 변수의 관계 찾기, 두개의 연속형 변수의 관계 찾기
- 차이를 설명하는 간단한 통계 모형 살펴보기
- 대학만 가면 끝일 줄 알았는데