생활데이타/이토록 쉬운 통계&R

이토록 쉬운 통계&R 1일차

개발의 여름 2018. 2. 6. 01:18

치킨 뜯고 공부하자 100일 프로젝트 대망의 첫날

이포스팅은 루비출판사에서 진행하는 공부하고 치킨 먹는 프로젝트의 후원을 받습니다.^^ http://m.post.naver.com/viewer/postView.nhn?volumeNo=12359301&memberNo=38315694&vType=VERTICAL

머릿말

part1

머릿말. 데이터 분석을 배우기 위해서 우리는 어디서부터 시작해야 할까요?

  • 아무리 복장합 데이터 분석도 목적과 과정을 살펴보면 어떤 차이를 확인하고 설명하려 합니다.
  • 통계학은 차이를 수학이라는 도구로 풀어냅니다.

프롤로그

  1. 문법보다 회화
  2. 차이를 이하해기 위한 통계
    • 진짜 목표는 데이터 속에 있는 차이는 확인하고 설명하는 것.
  3. 불확실성을 설명하는 통계
  4. 과거와 현재, 미래가 소통하는 언어

목차

PART 1 차이를 확인하는 데이터 요약

  1. 줌아웃
  2. 날줄과 씨줄
    • 데이터의 구성, 데이터와 데이터 공간
    • 알파벳을 활용한 예제 데이터의 표현, 기술 통계량과 변수 요약
  3. 순서대로 한줄서기
    • 정렬과 순서 통계량, 분위수, 사분위수와 다섯 숫자 요약, 상자그림, 히스토그램
  4. 더치페이와 N빵
    • 평균, 분산, 표준편차
  5. 물수능과 불수능
    • 표준화, 표준화 예제
  6. 먹고 싶은거 먹어, 난짜장
    • 동전던지기, 파이차트와 막대 그래프
  7. 0.000012%의 꿈, 로또
    • 확률, 확률을 활용한 당첨 번호 예측, 데이터 분석과 확률

PART 2 차이를 설명하는 통계 개념

  1. 범인은 이 안에 있다.
  2. 부전자전, 유전 연결고리
    • 산점도, 상관관계, 상관계수
  3. 40% 니가 하면 나도한다.
    • 교차표, 행, 백분율과 열 백분율, 열지도, 독립
  4. 최저가, 알고 보니 옵션가
    • 조건부 확룰과 심슨의 역설
  5. 아낌없이 주는 의사결정 나무
    • 모자이크 그림, 의사결정나무 모형
  6. 점심 뭐 먹지?
    • ABCDEF 테스트, 분산과 분산분석

PART 3 차이를 예측하는 통계 모형

  1. 우연과 운명 사이
  2. 지구는 우주의 티끌
    • 표본과 모집단 통계량과 분포, 자연스러운 확률
  3. 웬만해선 이길 수 없다.
    • 유의수준, 필요학과 같은 분포, 키의 히스토그램 정규분포
  4. 남자평균 174.9cm, 여자평균 162.3cm
    • 표본평균의 표준편차, 표본평균의 표준편차 계산, t-값과 t-분포
    • t-분포, p-값과 t-테스트
  5. 관계 검증을 위한 테스트
    • t-검정을 활용, 카이제곱분포를 활용한 독립성검정
    • F-분포를 활용한 분산분석
  6. 아빠 키유전 확률, 25%
    • 다시 한번 상관계수, 선형회귀모형, 부모 맘 같지 않은 자식

PART 4 데이터 분석 도구, R

  1. 그것이 R고싶다.
  2. R 시작하기
    • R설치, R Studio 설치, R Studio 실행
  3. 순서대로 살펴보는 BR31
  4. R로 분석 다시 보기
    • 하나의 연속형 변수를 요약하기, 하나의 변주형 변수를 요약하기
    • 두 개의 범주형 변수의 관계 찾기, 두개의 연속형 변수의 관계 찾기
    • 차이를 설명하는 간단한 통계 모형 살펴보기
  5. 대학만 가면 끝일 줄 알았는데