한눈에 알수있는 의학통계학 (Medical statistics at a glance,2/e)

한눈에 알수있는 의학통계학ANOVA가 뭐야? ANCOVA는?

저널들을 읽어가다 보면..
전혀 모르는 통계 이야기들을 보며..
완전 무식인 초라한 나를 보며..

나름 지식의 샘을 채우고자 샀다.

퇴근길에 전철에서 보다가..
깊은 잠의 나락으로 빠져들었다.


의학통계학은 의학 등의 연구에서 나타나는 자료의 특성에 맞게 적용될 통계적인 이론을 개발하는 학문이다. 즉, 의학통계학은 의학, 간호학, 보건학, 의생명공학 등과 통계학 간의 학문적 전문성이 적절히 결합된 형태인, 현대적인 학술적 요구의 산물이라 할 수 있다. 통계학적인 측면에서 봐도 이제 의학통계학은 단지 의학자료의 분석에 초점을 맞춘 응용통계학의 한 분야라고만 간주할 수 없을 정도로 이미 그 학문적 영역이 통계학 자체의 범주를 넘어서서 의학연구자들과 깊은 유대관계를 형성해가고 있고, 현재에도 그 이론은 계속 발전하고 있다. 즉, 의학통계학은 통계적 전문성을 기반으로 자체적인 이론의 개발, 의학자료의 특성 탐구, 의학연구의 목표달성을 위한 방법론적 기틀 제공 등을 추구하는 별도의 학문분야로 확립되고 있다. 국내에서는 의학통계학, 보건통계학, 또는 생물통계학 등 상황에 따라 다양한 명칭으로 불리고 있고, 영문 역시 medical statistics, public health statistics, 또는 biostatistics 등의 용어가 혼용되고 있다. 각각의 특성이 조금씩은 다르다고 할 수 있겠지만, 크게 묶어서 이 모두를 생통계학(biostatistics)이라 칭하는 것도 좋은 생각일 것 같다.

최근 들어 의학연구의 윤리적인 면이 사회적으로 이슈화되면서 임상연구에서의 의학통계학의 중요성이 부각되고 있다. 의학연구는 약제 및 시술방법들의 안전성 및 유효성을 검사하고 평가하는 과학적인 연구에 해당한다. 또한 의학연구는 인간을 대상으로 하는 연구이기 때문에 윤리적인 연구이어야만 한다. 의학통계학은 의학연구를 설계하고, 수행하고, 그 결과를 해석하는데 필수불가결한 도구일 뿐만 아니라, 연구의 윤리와 관련된 학문이기도 하다. 왜냐하면 타당하지 않은 연구 설계 하에서 연구를 진행하는 것은 연구자나 연구대상자 모두에게 시간 및 자원의 낭비일 뿐만 아니라 비윤리적이기도 하기 때문이다. 또한 실제 효과를 보이기에는 부족한 양의 표본 수를 가지고 연구를 수행하거나, 아니면 지나치게 많은 수의 표본을 가지고 연구를 수행하는 것 둘 다 환자의 권익을 침해하는 결과를 가져오게 되기 때문이다. 이에 더불어 연구의 결과를 제대로 해석하지 못하고, 그에 따라 연구결과를 잘못 적용하는 것도 비윤리적이다. 따라서 이제는 많은 의학연구자들이 의학통계학의 필요성 및 중요성을 점차 인식해 가고 있는 추세이고, 역자 역시 의학통계학에 관한 의학연구자들의 관심이 폭발적으로 증가하고 있음을 실제 피부로 느끼고 있다.

의학연구에서 의학통계학이 차지하는 중요도를 평가하기 전에, 연구수행의 전반적인 과정 중 의학통계학자들의 도움을 필요로 하는 부분이 어느 부분인가를 생각해본다면 의학통계학의 역할을 좀 더 쉽게 파악할 수 있을 것이다. 만일 이를 연구초기단계에서 단순히 표본수를 산정하는 것과 연구종료단계에서 자료를 분석하고 그 결과를 해석하는 정도라고 생각한다면 이는 전체가 아닌 일부분만을 파악한 것이다. 의학통계학자들의 역할은 연구가 과연 가능한지부터, 연구결과의 객관적인 타당성을 보장하기 위해서는 어떻게 연구가 설계되어야 하는지, 어떻게 시작되어야 하는지, 연구가 신뢰성을 확보할 수 있고 타당성이 보장되는 방향으로 수행되고는 있는지, 객관적이고 적절한 분석결과를 제시할 수 있는지, 이 분석결과를 논리적으로 표현할 수 있는지, 분석결과의 의미를 제대로 해석할 수 있는지, 누구나 연구결과를 이해할 수 있을 정도로 요약되고 정리된 형태로 제시할 수 있는지 등을 평가해주면서 의학연구의 처음부터 끝까지 의학연구자들과 함께 동행하는 동반자의 역할이라고 보는 것이 타당하다.

궁극적으로 의학연구가 성공적으로 이루어지기 위해서는 의학연구자, 의학통계학자, 그리고 의학연구와 관련된 다른 과학자들 간의 열린 그리고 효율적인 의사소통(an open and effective communication)이 필수불가결한 요소이다. 그러나 이러한 의사소통은 일방통행이 아니라 양방통행이어야만 한다: 의학통계학자들은 의학연구자들에게 통계적인 개념과 방법론들을 효과적으로 전달해야만 한다. 의학연구자들은 해당 의학연구의 주제와 관련된 임상적 그리고 과학적 원리들을 의학통계학자들에게 철저하고 충분하게 전달해주어야만 한다. 그러면 의학통계학자들은 이 원리들을 어떻게 통계적으로 타당한 가설이나 모형, 그리고 적절한 자료분석 방법들을 사용해 구현할 것인지에 대해 답변해줄 수 있게 될 것이다(Chow, S.C. and Liu, J.P. 2004. Design and Analysis of Clinical Trials, Wiley-VCH). 이에 더불어 상호 간의 의사소통은 서로가 이해할 수 있는 용어를 사용해 이루어져야만 한다. 왜냐하면 각자가 자신들의 용어만을 사용한다면 결국 상대방에게는 이해하기 힘든 암호일 뿐이기 때문이다. 결국 의학연구와 관련된 연구자들 간의 상호교류, 상호존중, 상호이해가 이루어질 때만 완전하고 수준 높은 질을 갖춘 의학연구가 성공적으로 수행될 수 있을 것이다. 의학연구자들이 기본적인 통계적 개념을 알고 있어야 하는 이유, 그리고 의학통계학자들이 의학연구자들과의 토론에 적극적으로 참여해야만 하는 이유가 바로 여기에 있다. 이러한 측면에서 볼 때 본서는 의학연구자들에게 매우 도움이 될 수 있는 책이다. 물론 제반 통계적 이론 및 방법론에 대한 충분한 내용을 깊이 있게 다루지는 못했지만, 가까이 두면서 자주 꺼내 볼, 그래서 의학연구자들과 의학통계학자들 간의 커뮤니케이션에 윤활유 역할을 할 수 있는, 동반자 같은 서적이 될 만한 가치가 충분히 있다.

At a glance를 ‘한눈에 알 수 있는’이라는 용어로 번역하는 것은 사실 마땅치가 않다. 학문을 어떻게 책 한권을 통해 가르칠 수 있고, 또 알 수 있겠는가? 독자들이 ‘한눈에 살펴보는’ 의학통계학이라는 개념으로 받아들여 주기를 바란다.

본 역서를 준비하는 과정 중에 함께 해주었던 고려대학교 보건대학원 학생들, 대학원 보건학과 학생들, 의과대학 의학통계학교실 대학원생들 및 동료 교수들에게 감사의 뜻을 전한다. 이래저래 바쁘다는 핑계로 남편노릇이나 아빠노릇을 부실하게 하는데도 당연히 그런가 보다 하고 별다른 불평이 없는 민정, 성환, 수환, 윤환에게 이제 번역이 끝나서 바쁘다는 핑계거리가 하나 줄어들었다는 것을 알려줄 수 있게 되어서 기쁘다.

2007년 8월

이 준 영


차 례
목 차
저자 서문 3
역자 서문 5

자료 다루기_Handling data
1 자료의 종류 8
2 자료입력 10
3 오류검토 및 이상치 12
4 그림으로 자료를 표현하기 14
5 자료의 기술: ‘평균적인 값’ 16
6 자료의 기술: ‘흩어진 정도’ 18
7 이론적인 분포들: 정규분포 20
8 이론적인 분포들: 기타 분포들 22
9 자료의 변환 24

표본추출과 추정_Sampling and estimation
10 표본추출 및 표본분포 26
11 신뢰구간 28

연구설계_Study design
12 연구설계 I 30
13 연구설계 II 32
14 임상시험 34
15 코호트 연구 37
16 사례畇陸?연구 40

가설검정_Hypothesis testing
17 가설검정 42
18 가설검정에서의 오류 44

기초적인 자료분석 방법_Basic techniques for analysing data수치형 자료
19 수치형 자료: 단일 집단 46
20 수치형 자료: 서로 관련이 있는 두 집단 49
21 수치형 자료: 서로 독립적인 두 집단 52
22 수치형 자료: 두 집단 이상 55

범주형 자료
23 범주형 자료: 단일 비율 58
24 범주형 자료: 두 비율 61
25 범주형 자료: 두 범주 이상 64

회귀와 상관
26 상관 67
27 선형회귀 이론 70
28 선형회귀분석의 실시 72
29 다중선형회귀 75
30 이진수 결과변수와 로지스틱 회귀 79
31 율과 포아송 회귀 82
32 일반화 선형모형 86
33 통계적 모형에서의 설명변수들 88
34 통계적 모형화에 관한 이슈들 91

고려해야 할 주요사항들
35 가정들의 검토 94
36 표본 수 계산 96
37 연구결과의 제시 99

추가항목_Additional chapters
38 진단검사 102
39 일치도 평가 105
40 근거-기반 의학 108
41 집락자료에 대한 분석방법 110
42 집락자료에 대한 회귀분석 방법들 113
43 체계적 문헌고찰 및 메타분석 116
44 생존분석 119
45 베이지안 방법론 122

부록_Appendix
A 통계표 124
B 표본 수 계산을 위한 알트만의 노모그램 131
C 일반적인 컴퓨터 분석결과의 형태 132
D 용어사전 144

참고문헌 153
국문 찾아보기 161
영문 찾아보기 168