숲을 보고 나무를 배우다(1권-통계학의 원리)

오재상 숲을 보고 나무를 배우다

0(0)

정가

33,000원
판매가
0% 33,000원
me포인트

최대로 받을 수 있는 예상 적립액입니다.
최종 결제하는 금액에 따라 달라질 수 있으니,
정확한 적립 포인트는 결제 페이지에서 확인해주세요.
최대 1,750P 적립
- 구매 적립 5%
  
  1,650P
- 최대 리뷰 적립
  
  100P

구매 전 반드시 유의사항을 확인해주세요.

iOS / Android 모바일 및 태블릿에서 이용 가능하며, PC는 지원하지 않습니다.

통계 개념을 제대로 배우고 싶은 독학자, 실무 분석가, 데이터 입문자를 위한 책
통계학의 핵심 개념을 직관적이고 논리적인 연결 속에서 이해하고 적용하는 법
숲과 나무 관점으로 통계 개념을 익히고, 실무에 연결하는 데이터 분석 입문서

서론 : 왜 통계학인가?
1. 통계학이 중요한 이유
2. 이 책의 목적
3. 이 책을 활용하는 방법
4. 이 책의 구성
5. 이 책의 통해 얻을 수 있는 것
제 1 장: 통계학에 대한 접근 방식
1.1 통계학의 숲과 나무
1.1.1 숲의 관점: 통계학의 전체적인 흐름 이해하기
1.1.2 나무의 관점: 개별 개념을 하나씩 깊이 있게 이해하기
1.1.3 숲과 나무를 연결하는 구성 흐름
1.2 숲과 나무 관점의 연결 구성도
1.2.1 연결 구성도: 통계학 개념들이 서로 연결되는 지도
제 2 장: 자료의 이해
2.1. 자료 유형과 분류
2.2 자료 유형과 데이터 분석 기법 연결
2.3. 자료 유형과 DB 데이터 타입 매핑
2.4. 자료 유형과 데이터 분석 관점에서의 통합
2.5. 실전 분석 예제 (R을 활용한 분석)
2.5.1 예제 1: 명목형 데이터의 빈도 분석
2.5.2 예제 2: 서열형 데이터 변환 및 빈도 분석
2.5.3 예제 3: 등간척도와 비율척도의 차이 비교
제 3 장: 자료의 정리와 시각화
3.1 자료의 정리
3.1.1 도수분포표
3.1.2 누적도수표
3.1.3 교차표
3.2 시각화 기초
3.2.1. 그래프 종료 및 활용
3.2.2 그래프 활용 방법
3.2.3 막대그래프( Bar Chart )
3.2.4 원그래프( Pie Chart )
3.2.5 히스토그램( Histogram )
3.2.6 상자그림( Boxplot )
3.2.7 산점도( Scatter plot )
3.2.8 꺽은선 그래프( Scatter plot )
3.3 자료 정리와 시각화의 중요성
3.3.1 EDA에서 자료 정리와 시각화의 역할
3.3.2 잘못된 시각화와 데이터 왜곡의 사례
제 4 장: 기술 통계
4.1 중심 경향치
4.1.1 평균 (Mean)
4.1.2 중앙값 (Median)
4.1.3 최빈값 (Mode)
4.2 산포도
4.2.1 범위 (Range)
4.2.2 분산 (Variance)
4.2.3 표준편차 (Standard Deviation)
4.2.4 공분산(.Covariance ) & 상관계수( Correlation Coefficient )
4.2.5 변동(변이) 게수(Coefficient of Variation, CV)
4.3 데이터 분포
4.3.1 왜도 (Skewness)
4.3.2 첨도 (Kurtosis)
제 5 장: 확률과 확률분포
5.1 확률의 개념과 기본 원리
5.1.1. 표본공간과 사건의 개념
5.1.2. 확률이란 무엇인가?
5.1.3. 확률을 구하는 3가지 방법
5.1.4 확률의 성질
5.1.5. 확률 연산법칙
5.2. 확률변수와 확률분포
5.2.1. 확률변수란?
5.2.2. 확률변수의 종류
5.2.3. 확률분포란?
5.2.4. 누적분포함수 (CDF, Cumulative Distribution Function)
5.3. 이산형 확률분포
5.3.1 베르누이 분포((Bernoulli Distribution)
5.3.2 이산형 균등분포
5.3.3 초기하 분포 (Hypergeometric Distribution)
5.3.4 이항분포 (Binomial Distribution)
5.3.5 포아송분포 (Poisson Distribution)
5.4. 연속형 확률분포
5.4.1 정규분포(Normal Distribution)
5.4.2 연속형 균등분포(Continuous Uniform Distribution)
5.4.3 지수분포(Exponential Distribution)
5.4.4 카이제곱분포 (Chi-Square Distribution)
5.4.5 t-분포 (Student’s t-Distribution)
5.4.6 F-분포 (F-Distribution)
5.5. 확률분포의 특성 분석
5.5.1 중심극한정리(Central Limit Theorem, CLT)
5.5.2 확률분포와 모집단 추론
제 6 장: 표본분포
6.1 표본분포란 무엇인가?
6.1.1 모집단과 표본의 개념
6.1.2 표본을 선택하는 방법 (Sampling Methods)
6.1.3 표본통계량의 개념 (표본평균, 표본분산, 표본비율 등)
6.2 표본평균의 분포
6.2.1 표본평균이란?
6.2.2 표본평균의 기대값과 분산
6.2.3 모집단이 정규분포일 때, 표본평균의 분포
6.3 표본분산의 분포
6.3.1 표본분산이란?
6.3.2 자유도의 개념
6.3.3 표본분산과 모집단 분산의 관계
6.4 표본비율의 분포
6.4.1 표본비율이란?
6.4.2 표본비율의 기대값과 분산
6.4.3 표본비율의 정규분포를 따르는 이유
6.5 카이제곱분포, t-분포, F-분포의 활용
6.5.1 표본분산의 분포와 카이제곱분포 활용
6.5.2 모집단 분산이 알려지지 않았을 때 t-분포 활용
6.5.3 분산 비교를 위한 F-분포 활용
6.5.4 최종 정리
제 7 장: 추론통계: 추정과 검정
7.1 추론통계의 개념
7.1.1. 추론통계란 무엇인가?
7.1.2 추론이란 무엇인가?
7.1.3 모집단을 직접 조사하지 않고 표본을 활용하는 이유
7.1.4 점추정과 구간추정의 차이
7.2 점추정과 불편추정량
7.2.1 점추정이란?
7.2.2 좋은 추정량의 조건(불편성, 일치성, 효율성)
7.2.3 표본평균, 표본비율의 점추정
7.2.4 요약 정리
7.3 신뢰구간(Confidence Interval) 및 신뢰수준
7.3.1 신뢰구간이란?
7.3.2 신뢰수준과 표본 크기의 관계
7.3.3 정규분포를 이용한 모집단 평균의 신뢰구간
7.3.4 t-분포를 이용한 작은 표본의 신뢰구간
7.4 가설검정의 개념
7.4.1 가설검정이란?
7.4.2 귀무가설과 대립가설의 개념
7.4.3. 1종 오류(Type I Error)와 2종 오류(Type II Error)
7.4.4 유의수준(Significance Level, α)의 의미
7.4.5 P-value(유의확률)의 개념과 해석
7.4.6 가설검정의 전체 흐름
7.5 평균에 대한 가설검정
7.5.1. 단일 모집단 평균 검정 (z-검정, t-검정)
7.5.2 두 모집단 평균 비교 (독립표본 t-검정, 대응표본 t-검정)
7.5.3 평균 가설검정의 전체 과정
7.5.4 평균 가설검정의 활용 예시
7.5.5 요약 정리
7.6 비율과 분산에 대한 가설검정
7.6.1 단일 모집단 비율 검정 (One-Sample Proportion Test)
7.6.2 두 모집단 비율 비교 검정 (Two-Sample Proportion Test)
7.6.3 분산 비교를 위한 F-검정 (F-Test for Variance Comparison)
7.6.4 요약 정리
7.7 가설검정의 실제 활용 사례
7.7.1 신약 실험에서의 효과 검정
7.7.2 선거 여론조사 결과 해석
7.7.3 마케팅 A/B 테스트 분석
제 8 장: 통계 분석
8.1 분석 기법의 개요
8.2 분포 및 데이터 특성 분석
8.2.1 적합도 검정 (Goodness-of-Fit Test)
8.2.2 독립성 검정 (Chi-square Test for Independence)
8.2.3 동질성 검정 (Chi-square Test for Homogeneity)
8.2.4 정규성 검정 (Normality Test)
8.2.5 등분산 검정 (Equality of Variance Test)
8.2.6 이상치 탐지( Boxplot, IQR, Mahalanobis Distance)
8.3 평균 및 집단 비교 분석
8.3.1 t-검정
8.3.1.1 단일표본 t-검정( One-Sample ?Test )
8.3.1.2 독립표본 t-검정 (Independent T-test)
8.3.1.3 대응표본 t-검정 (Paired T-test)
8.3.2 분산분석(ANOVA, 일원/이원 ANOVA)
8.3.2.1 일원 분산분석(One-Way ANOVA)
8.3.2.2 이원 분산분석(Two-Way ANOVA)
8.3.3 공분산분석(ANCOVA)
8.4 회귀 및 예측 분석
8.4.1 단순회귀분석(Simple Regression)
8.4.2 다중회귀분석 (Multiple Regression)
8.4.3 회귀진단(잔차 분석, 다중공선성, 오차항 분석)
제 9 장: (부록) R의 기초 사용법 이해
9.1 자료 구조와 접근 방식
9.1.1 vector(벡터)
9.1.2 Factor(팩터)
9.1.3 Matrix(행렬)
9.1.4 Data Frame(데이터프레임)
9.1.5 List(리스트)
9.2 변수와 함수
9.2.1 변수란 무엇인가?
9.2.2 변수의 데이터 유형
9.2.3 함수란 무엇인가?
9.2.4 사용자 정의 함수 만들기
9.2.5 변수와 함수 활용하기
9.3 자료 구조 변환 및 연산 기호
9.3.1 자료 구조 변환
9.3.2 연산 기호 (Operators)
9.3.3 논리 연산(Boolean Operators)
9.3.4 집합 연산 (Set Operations)
9.4 패키지 이해
9.4.1 R 패키지란?
9.4.2 패키지 설치 및 불러오기
9.4.3 자주 사용하는 필수 패키지
9.4.4 CRAN과 GitHub 패키지
제 10 장: 데이터 조작 및 시각화 이해
10.1 SQL과 dplyr 개요
10.1.1 SQL과 dplyr의 개념 및 관계 이해
10.1.2 SQL과 dplyr이 데이터 조작에서 수행하는 역할 비교
10.1.3 요약 및 학습 목표
10.2 MariaDB 설치하기
10.2.1 MariaDB 설치
10.3 SQL 기초 이해
10.4 dplyr 기초 이해
10.5 SQL과 dplyr을 활용한 데이터 조작
10.6 tidyr을 활용한 데이터 정리
10.6.1 tidyr 패키지란?
10.6.2 Tidy Data란?
10.6.3 tidyr의 주요 함수
10.6.4 주요 함수 활용 예제
10.6.5 정리
10.7 Join을 활용한 데이터 조작
10.7.1 Join이란?
10.7.2 Join의 종류
10.7.3 SQL에서 Join 사용법
10.7.4 dplyr을 활용한 Join
10.7.5 Join을 활용한 데이터 분석
10.8 ggplot2를 활용한 데이터 시각화
10.8.1 ggplot2란?
10.8.2 ggplot2의 기본 문법
10.9 정규 표현식의 이해 및 활용
10.9.1 정규 표현식(Regular Expression) 이란?
10.9.2 정규 표현식의 기본 문법
10.9.3 R에서 정규 표현식 활용하기
10.9.4 정규 표현식 실습 예제
10.10 stringr을 활용한 문자열 조작
10.10.1 stringr 패키지란?
10.10.2 stringr 패키지 주요 함수 소개
10.10.3 stringr 패키지 활용 예제
10.10.4 stringr 패키지를 활용한 데이터 전처리
10.10.5 정리 및 결론
참고 문헌

저자(글) : 오재상

IT 경력 30년 중 26년간 CRM 실무와 데이터 관련 업무에 몰두해왔으며, 그중 18년은 데이터 분석과 컨설팅에 집중해왔습니다. 분석과 컨설팅에 필수적인 통계학은 총론부터 각론까지 18년에 걸쳐 독학으로 체계적으로 습득하였고, 이를 기반으로 현장에서 실무와 이론을 유기적으로 접목해온 데이터 분석 전문가입니다. 특히 데이터와 관련된 업무는 A부터 Z까지 전 과정을 수행할 수 있는 통합적 역량을 갖추고 있습니다.

0개 리뷰

5점

4점

3점

2점

1점

도서 구매 후 리뷰 작성이 가능합니다.

리뷰 (0)

등록된 리뷰가 없습니다.

상품 정보

저자

오재상

출간일

2025-05-31

ISBN

9791199277502

형식/용량

PDF / 30.91MB

카테고리 분류

대학교재 > 생활과학계열

메뉴

카테고리

카테고리 레이어