박영사

SITEMAP
전체메뉴닫기
박영사/박영스토리 분야별 도서
닫기
실험 논문 작성을 위한 통계학의 정석
신간
실험 논문 작성을 위한 통계학의 정석
저자
최지범
역자
-
분야
통계/연구방법
출판사
박영사
발행일
2023.08.22
개정 출간예정일
페이지
275P
판형
크라운판
ISBN
979-11-303-1812-7
부가기호
93320
강의자료다운
정가
18,000원

중판 2024.03.20

초판 2023.08.22

대학원을 다니며 놀랐던 점 중 하나는 많은 연구자들이 통계에 대한 기초지식 없이 데이터를 분석하고 논문을 작성한다는 것이다. 이들은 3개의 실험군 중 두 실험군을 골라 정규성 검정(Normality test)도 없이 t-test를 수행하고, 선형 회귀(Linear regression)를 수행한 후 잔차(Residual)를 분석하지 않는다(만일 이런 행태가 괜찮다고 생각한다면 이 책을 정독할 필요가 있다). 이런 원시적이고 초보적인 수준의 오류는 우리 대학원에 만연해 있으며, 그런 식으로 통계를 돌려 논문을 작성하면 좋은 저널에서는 바로 게재 거부(Rejection) 결정을 내릴 것이다. 이걸 작성자 탓만 할 수 없는 게, 대학원에서는 이런 실용적인 통계 기술을 잘 가르치지 않는다. 통계학과에서 여러 수업을 개설하지만, 그런 수업은 대체로 이론적인 면에 치중되어 있다. 애당초 통계학 강사들은 실험 경험이 거의 없는 경우가 많아 수식만 설명할 뿐 현실과 동떨어진 이야기를 자주 한다. 실용 통계를 제대로 가르치기 위해서는 통계 지식을 갖출 뿐만 아니라 직접 실험을 설계, 수행하며 밤새 데이터를 모아보고, 그 데이터로 실험 논문을 작성해 발표한 경험이 있어야 한다. 이런 조건을 갖춘 강의자가 드물기에 논문 작성에 실질적으로 필요한 통계 기술을 배울 기회는 많지 않다. 통계 분석은 연구의 부수적인 부분이 아니라 핵심 요소 중 하나인데, 이를 간과하고 논문을 쓰는 것은 개탄스러운 일이다.

이런 문제의식 속에서 나는 2020년부터 생명과학부 대학원생을 대상으로 실용적인 통계 특강을 진행했다. 수업이 쉽고 친절하다는 입소문을 타면서 서울대학교 화학부와 고양 명지병원에서도 강의 요청이 들어왔다. 통계 특강을 열 때마다 지원자가 많아 모두에게 수강의 기회를 줄 수 없었다. 몇몇 타과 학생은 통계 특강을 수강하고 싶다며 절실함 가득한 메일을 보내기도 했다. 나 또한 제한된 시간에 모든 통계 이야기를 할 수 없어 아쉽기도 했다. 때문에 이런 실용 통계 기술을 더 널리 소개하고 싶어, 실험 논문 작성에 필요한 통계 기술을 한 권의 책으로 묶었다.

통계학의 철학과 기술을 최대한 알기 쉽게 전달해서, 실험 연구에 익숙한 독자가 스스로 자신의 데이터를 분석할 수 있도록 만드는 것이 이 책의 목표이다. 그 분석 결과를 논문에 어떻게 쓰는지 아는 것도 중요하다. 복잡한 수식만 앞세우는 그런 책이 아니라, 이론에도 충실하면서 내용을 알기 쉽게 전달하는 것이 이 책의 특징이라 할 수 있다. 이 책을 읽은 연구자가 자신의 데이터에 가장 알맞은 통계 검정법을 자신 있고 정확하게 사용하여 좋은 저널에 논문으로 출간하기를 희망한다.

이 교재를 검토해 여러 오류를 잡아준 서울대학교 생명과학부의 김재승에게 감사를 표한다. 이 책을 선택해 준 박영사와 정연환 선생님, 편집을 맡아준 김민조 선생님께 감사드린다. 무엇보다도 어려울 때나 즐거울 때나 늘 힘이 돼준 나의 가족에게 이 책을 바친다.

 

저자 최지범

최지범

서울대학교 자유전공학부에서 수학과 생명과학을 전공한 후 서울대 생명과학부 대학원에서 이론 생물학과 동물 행동학 연구로 박사학위를 받았다. 이후 경희대학교 응용수학과 학술연구교수로 연구를 이어가고 있다. 4권의 과학 교양서를 저술했으며 서울대학교 생명과학부, 화학부 대학원과 명지병원 등에서 실험 논문 작성을 위한 실용 통계학을 강의했다.

Chapter 01 통계학의 철학(The Zen of Statistics)


 1.1 확률 변수란 무엇인가 11

 1.2 확률밀도함수 12

 1.3 평균과 분산 15

 1.4 중앙값(Median)과 IQR 17

 1.5 최빈값(Mode)과 왜도(Skewness) 19

 1.6 평균과 분산의 성질 1 21

 1.7 평균과 분산의 성질 2 24

 1.8 확률 변수의 독립성 28

 1.9 공분산과 상관관계 31

1.10 (참고) 피어슨 상관계수와 코시-슈바르츠 부등식 33

1.11 모집단과 표본집단 36

1.12 표본분산의 계산 39

1.13 이항 분포와 정규 분포 42

1.14 중심극한정리와 정규 분포에 대한 오개념 45

1.15 유효숫자와 정밀성 47



Chapter 02 가설 검정법(Hypothesis Testing)


 2.1 오류의 종류 53

 2.2 p-value의 의미 55

 2.3 p-value의 해석 58

 2.4 p-value가 크다면 60

 2.5 p-value가 작다면 62

 2.6 p-value 시뮬레이션 63

 2.7 비율 검정법을 통해 p-value 구하기 64

 2.8 단측검정과 양측검정 68

 2.9 민감도(Sensitivity)와 특이도(Specificity) 70

2.10 출간 편향과 깔때기 그림 72


Chapter 03 t-test, F-test


 3.1 통계 검정법의 가정 77

 3.2 카이제곱 분포 81

 3.3 모분산과 표본분산의 관계 83

 3.4 t-분포를 사용하는 이유와 그 특징 86

 3.5 One-sample t-test와 Paired t-test 88

 3.6 F-분포의 정의 91

 3.7 여러 그룹에 대한 데이터 비교 93

 3.8 Two-sample t-test 96

 3.9 t-test의 전제 조건 99

3.10 F-test를 통한 분산의 확인 104

3.11 적합한 통계 방식을 결정하기 106

3.12 신뢰 구간(Confidence interval) 108



Chapter 04 일원 분산분석(One-way ANOVA)


 4.1 명제와 논리 115

 4.2 다중 비교(Multiple comparison)의 문제점 117

 4.3 그냥 없다고 생각하면 안 되는가? 120

 4.4 요인(Factor)과 수준(Level) 121

 4.5 ANOVA의 구조 123

 4.6 One-way ANOVA의 가정과 용어 125

 4.7 One-way ANOVA의 통계 검정 128

 4.8 One-way ANOVA의 p-value 계산 131

 4.9 자유도란 도대체 무엇인가 133

4.10 One-way ANOVA의 예시 135

4.11 사후 분석(Post hoc analysis) 138

4.12 Intra-Ocular Trauma Test 140

4.13 간편한 사후 검정: Bonferroni correction 141

4.14 Repeated measures ANOVA의 필요성 142

4.15 Repeated measures ANOVA의 계산 143

4.16 Repeated measures ANOVA의 예시 146

4.17 구형성 가정(Sphericity assumption) 149

4.18 결측치(Missing data)의 처리 150



Chapter 05 이원 분산분석(Two-way ANOVA)


5.1 Two-way ANOVA의 구조 158

5.2 Two-way ANOVA 계산의 의미 159

5.3 Two-way ANOVA의 자유도 162

5.4 Two-way ANOVA의 예시 165

5.5 교호작용이 유의미한 경우 167

5.6 Two-way Repeated measures ANOVA 168

5.7 Factorial ANOVA 170



Chapter 06 회귀 분석(Regression Analysis)


 6.1 데이터의 종류와 그에 따른 통계 검정 175

 6.2 상관성과 인과성 176

 6.3 Anscombe’s quartet 178

 6.4 선형 관계(Linear relationship) 182

 6.5 기울기와 절편의 추정 184

 6.6 (참고) 왜 오차의 절댓값이 아닌 제곱을 최소화하는가? 186

 6.7 기울기의 통계적 유의미성 187

 6.8 회귀의 자유도와 F-test 188

 6.9 회귀를 시행한 후 확인해야 할 것 191

6.10 오목함수와 볼록함수 193

6.11 차수를 활용한 변환 194

6.12 상관계수와 회귀계수 197



Chapter 07 고급 회귀(Advanced Regression)


 7.1 다중회귀 분석(Multiple regression analysis) 201

 7.2 회귀를 행렬로 표현하기 204

 7.3 회귀계수에 대한 t-test 205

 7.4 Variance Inflation Factor(VIF) 207

 7.5 교호작용(Interaction)과 2차식 모델(Quadratic model) 208

 7.6 일반화 선형 모델과 비선형 모델 209

 7.7 Logistic regression 211

 7.8 Stepwise model selection 214

 7.9 모델을 만드는 원리 217

7.10 ANCOVA 219


Chapter 08 비모수분석(Non-Parametric Tests)


8.1 점 4개로 0에 가까운 p-value 만들기 225

8.2 정규성 검정에 대한 고찰 226

8.3 첨도(Kurtosis)와 왜도(Skewness) 227

8.4 카이제곱 검정법 230

8.5 Rank sum test(Mann-Whitney U test) 233

8.6 Wilcoxon signed-rank test 235

8.7 ANOVA를 대신하는 비모수 검정법 236



Chapter 09 문제 및 사례