초판발행 2025.06.13
머리말
이 책은 기업 현장에서 데이터 기반의 인적자원관리를 담당하는 실무자와 이 분야로 진출하기를 희망하는 미래의 피플 애널리스트들을 위한 실무 도서이다. 피플 애널리틱스는 인적자원관리라는 맥락과 데이터 분석 기술이 교차하는 분야라고 할 수 있다. 따라서 유능한 피플 애널리스트가 되려면 맥락과 기술이라는 두 마리 토끼를 잡아야 하는 셈이다.
지난 몇 년간 대학원생들과 피플 애널리틱스 세미나를 진행해 오면서 겪었던 어려움 중 하나가 바로 이 두 마리 토끼를 모두 겨냥한 괜찮은 교재를 찾을 수 없다는 점이었다. 피플 애널리틱스의 개념과 목적, 활용 사례, 접근 방법 등을 정리한 책들은 꽤 있었지만, 기업 현장의 실제 데이터를 직접 다루어 보는 책은 거의 없었다. 데이터 분석 중심으로 쓰인 책이 없지는 않았다. 하지만, 대부분이 통계학이나 프로그래밍에 치우쳐 있어서, 인적자원관리라는 본연의 맥락을 구현하는 데에는 일정한 한계를 가지고 있었다. 그마저도 주로 해외 도서들이라 접근성이 현저히 떨어지는 편이었다.
그러던 차에 대학원생들 몇 명이 차라리 우리 연구실에서 괜찮은 피플 애널리틱스 도서를 한번 써 보자고 제안했다. 그동안 쌓아온 역량이라면 충분히 가능하겠다 싶어서 곧바로 대학원생들과 의기투합하여 준비에 들어갔다. 주요 HR 분야를 정한 뒤 각자 한두 분야를 맡아 분야별 쟁점 정리, 핵심 이슈 발굴, 데이터 정리와 분석, 상호 피드백과 검토 등을 한 단계씩 밟아나갔다. 그 과정을 거쳐 나온 산물이 바로 이 책이다. 그동안 지도교수의 닦달에도 묵묵히 애써준 대학원생들에게 먼저 감사의 말을 전해야 할 것 같다.
이 책의 특징
이 책은 인적자원관리의 일곱 가지 핵심 분야, 즉 채용관리, 성과관리, 보상관리, 직원 몰입, 이직관리, 조직문화, 다양성관리 등으로 목차가 구성되어 있다. 각 장마다 해당 분야와 관련된 핵심 쟁점을 간략히 정리하고, 그다음에 기업이 실제로 당면하고 있는 문제 상황에 대한 피플 애널리틱스 이슈 리포트를 넣었다.
이 리포트가 이 책이 가지고 있는 핵심적인 특징이다. 리포트를 따라 하나씩 실습하다 보면, 해당 이슈뿐만 아니라 다른 HR 이슈에도 적용할 수 있는 HR 데이터 분석 역량을 차곡차곡 쌓아 나갈 수 있을 것이다. 독자들은 실제 HR 이슈에 적합한 데이터의 형태와 구조를 확인할 수 있고, R 실습을 병행하면서 분석의 전 과정을 몸에 익힐 수 있을 것이다.
활용하는 분석 방법도 가급적 다양하게 구성하려고 노력했다. 기술통계, 빈도분석, t-test, 분산분석과 같은 간단한 통계 분석 방법부터 조금 복잡한 통계 기법과 머신러닝 기법까지 실무에서 사용할 수 있는 다양한 분석 도구를 소개했다. 생존분석과 같이 난이도는 다소 높지만, 피플 애널리스트들이 꼭 알아두어야 할 방법론도 포함하였다. 이슈 리포트의 주제와 주요 분석기법은 아래 표와 같다.
장
Case Report 주제
주요 분석기법
인재 선발
채용 데이터를 활용한 부서 맞춤형 인재 선발 전략
t-test, 로지스틱 회귀분석
성과관리
고성과 직원의 특성 분석을 통한 효율적인 성과관리 방안
로지스틱 회귀분석, 머신러닝(분류)
보상관리
급여 데이터 분석을 통한 보상 체계 개선 방향
분산분석, 회귀분석, 로지스틱 회귀분석
직원 몰입
직원 몰입 지표 구성 및 직원 몰입 제고 방안
주성분 분석, 회귀분석
이직관리
우리 조직 신입사원이 퇴사하는 이유
카이제곱 검정, 로지스틱 회귀분석, 생존분석
조직문화
조직문화 인식에 차이가 나는 원인 탐색
확인적 요인분석, K-Means 클러스터링
다양성관리
성별 다양성의 현황과 모성보호제도 사
용이 승진에 미치는 영향
카이제곱 검정, 로지스틱 회귀분석
책에는 딥러닝과 같이 복잡한 데이터 분석기법은 포함하지 않았다. 그 이유는 크게 두 가지이다. 첫째는 여기에 포함된 분석 방법만으로도 대부분의 HR 이슈를 다루는 데 큰 어려움이 없기 때문이다. 두 번째 이유는 보다 현실적이다. 알고리즘 기반의 복잡한 분석기법들을 상세히 소개하려면 상당한 분량을 할애해야 하는데, 이렇게 되면 리포트가 산만해지고 HR 맥락에서 너무 멀어질 수밖에 없다. 이것은 이 책이 지향하는 바와는 거리가 있다. 이 책에 포함된 분석 방법만 잘 익히고 적용할 수 있다면, 현장에서 발생하는 대부분의 HR 이슈를 다루는 데 큰 문제는 없을 것이다.
책의 활용 방법
본론에 해당하는 2장부터 8장까지는 서로 독립적이다. 따라서 처음부터 끝까지 순서대로 따라갈 필요는 없다. 각자의 관심에 맞춰 읽는 순서를 정해도 무방하다.
이슈 리포트는 기업이 직면하고 있는 문제에 대한 분석 리포트이다. 따라서 맨 앞에 나오는 문제 정의를 꼭 숙지한 뒤, 분석에 활용한 데이터의 형태, 구조, 변수구성 등을 꼼꼼히 확인해 보기 바란다. 리포트에는 분석 단계별로 분석 과정을 상세히 설명했고 분석 결과에 대한 해석도 이해하기 쉽도록 제시했다. 이 책과 함께 제공되는 분석 데이터와 R 스크립트를 가지고 하나씩 실습해 보기를 권한다.
이슈 리포트에서는 주요 분석 방법에 대해 알기 쉽게 설명해 놓았다. 다만, 이 책이 방법론 학습을 목적으로 한 것이 아니기 때문에, 각 분석 방법을 A부터 Z까지 상세히 설명하는 것은 지양했다. 대신에 분석 방법의 목적, 논리, 적용 상황, 결과 해석 방법 등을 이해하기 쉽게 풀어서 설명하려고 노력했다. 분석 방법의 통계적, 수리적 기초까지 학습할 수는 없지만 분석을 따라가는 데에는 문제 없을 것이다. 분석 방법을 조금 더 깊게 공부하고 싶은 독자는 관련된 방법론 도서를 찾아보기를 권한다.
이슈 리포트를 활용하여 학습하는 데 필요한 사항이나 학습 팁을 몇 가지 소개한다.
① 이슈 리포트에서 사용하는 데이터와 R 스크립트는 다음 사이트에서 다운받을 수 있다[박영사 홈페이지(www.pybook.co.kr) ? 도서자료실 / smuba.net ? 자료실].
② 이 책은 R 프로그래밍을 학습하기 위한 책은 아니다. 하지만 실습에서 R을 활용하기 때문에 초급 수준의 R 프로그래밍 지식을 가지고 있으면 좋다. 함께 제공되는 R 스크립트를 보고 각 코드가 무엇을 의미하는지 대략적으로 이해할 수 있는 수준이면 충분하다. 실습을 따라 하다가 어려움을 느낀다면, 잠시 짬을 내어 R 기초 정도를 먼저 학습해 보는 것도 좋다. 유튜브나 블로그에도 좋은 학습자료가 많다. 굳이 두꺼운 R 프로그래밍 도서를 처음부터 끝까지 공부하지 않아도 괜찮다.
③ 이슈 리포트에는 R 코드 한줄 한줄에 대한 설명을 상세히 적어 놓았다. 각 장의 맨 뒤에 있는 코드 번호에 맞추어 본문에도 번호를 달아놓았다. 번호를 따라가면서 코드를 실행하면 좋을 것이다.
④ 이슈 리포트 본문에는 각 코드가 어떻게 작동하는지, 무엇을 의미하는지, 어떤 결과를 얻고자 하는 것인지 등을 설명해 놓았다. 가급적 상세히 설명은 해 놓았으나, 혹시 이해가 안 되는 부분이 있다면 AI 도구들을 활용해 보면 좋다. 코드를 복사해서 붙여 넣고 설명을 요청하면 각 코드에 대한 상세한 설명을 확인할 수 있다.
⑤ 책에 나와 있는 코드를 실행하다 보면 오류가 날 수도 있다. 코드 자체의 문제라기보다는 버전이나 패키지와 관련된 오류일 가능성이 높다. 만약 패키지가 설치되지 않아서 생기는 오류라면, install.packages(“설치할 패키지 이름”)와 같이 패키지를 먼저 설치하고 코드를 실행하면 된다. 예를 들어, library(randomForest)를 실행했는데 오류가 난다면 randomForest 패키지가 설치되어 있지 않기 때문이다. 따라서 install.packages(“randomForest”)를 먼저 실행하여 패키지를 설치한 후 library(randomForest)를 실행하면 문제없이 다음으로 넘어갈 수 있다.
좋은 피플 애널리틱스 실무 도서를 만들어보겠다는 일념 하나로 시작했던 작은 프로젝트가 이렇게 멋진 도서로 결실을 맺을 수 있었던 것은 그동안 물심양면으로 힘써 주신 박영사 덕분이다. 기획, 편집, 교정, 디자인 등 단계마다 애써주신 박영사 관계자 모든 분께 진심을 담아 감사의 말씀을 드린다. 마지막으로 이 책이 독자들의 경력과 학업에 조금이나마 도움이 되기를 바라면서, 새로운 HR 이슈들과 분석 방법론을 담은 후속 도서로 다시 만날 수 있기를 기대한다.
저자들을 대표하여
정동일 드림
I. 피플 애널리틱스
1. 피플 애널리틱스란 무엇인가? 5
2. 피플 애널리틱스의 핵심 구성요소 8
2.1. 데이터 8
2.2. 분석 기법 9
2.3. 분석의 맥락 10
3. 이 책의 구성 11
II. 인재 선발
1. 인재 선발 15
2. 선발 기준의 변화: 오버스펙에서 온스펙으로 16
3. 효과적인 선발을 위한 방안 17
3.1. 신뢰도와 타당도 확보 18
3.2. 면접자의 편견 최소화 19
[Case Report] 채용 데이터를 활용한 부서 맞춤형 인재 선발 전략 21
1. 문제 정의 21
2. 활용 데이터 소개 23
3. 데이터 전처리 24
4. 탐색적 분석 26
5. 채용 평가 점수와 성과 간의 관계 31
6. 채용 평가 점수를 통해 본 고성과자 특성 분석 37
7. 부서 단위 문화 적합성과 직무 적합성이 성과에 미치는 영향 43
8. 핵심 인사이트 50
인재 선발 R코드 52
III. 성과관리
1. 성과 평가 61
2. 성과 평가 방법 63
2.1. 목표 설정 63
2.2. 현대적 성과 평가의 특징 64
2.3. 성과 평가의 단위 65
3. 평가의 객관성과 공정성 66
[Case Report] 고성과 직원의 특성 분석을 통한 효율적인 성과 관리 방안 69
1. 문제 정의 69
2. 활용 데이터 소개 70
3. 데이터 전처리하기 71
4. 탐색적 분석 73
5. 로지스틱 회귀분석 75
6. 머신러닝 기반 성과 예측 82
7. 핵심 인사이트 89
성과관리 R코드 91
IV. 보상관리
1. 보상의 정의와 구성요소 99
2. 보상의 기준 100
2.1. 시장 기준 101
2.2. 직무 구조 101
2.3. 급여 구조 102
2.4. 직무 그룹 102
3. 보상 체계 설계 시 고려사항 103
[Case Report] 급여 데이터 분석을 통한 보상 체계 개선 방향 105
1. 문제 정의 105
2. 활용 데이터 소개 106
3. 데이터 전처리 106
4. 탐색적 분석 109
5. 기본급과 성과급에 영향을 미치는 요인: 단변량 분석 114
6. 기본급과 성과급에 영향을 미치는 요인: 다변량 분석 125
7. 핵심 인사이트 135
보상관리 R코드 137
V. 직원 몰입
1. 직원 몰입이란 147
2. 직원 몰입의 다양한 정의와 측정 도구 150
2.1. 욕구-만족 접근법(Need-Satisfying Approach) 151
2.2. 소진-반제 접근법(Burnout-Antithesis Approach) 151
2.3. 다차원 접근법(Multidimensional Approach) 152
2.4. 만족-몰입 접근법(Satisfaction-Engagement Approach) 153
2.5. 그 외의 조직 몰입 정의와 측정 도구 154
[Case Report] 직원 몰입 지표 구성 및 직원 몰입 제고 방안 155
1. 문제 정의 155
2. 활용 데이터 소개 156
3. 직원 몰입 지표 구성: 주성분 분석 157
4. 변수 간 상관관계 확인 163
5. 직원 몰입에 영향을 미치는 요인 분석 165
6. 핵심 인사이트 173
직원 몰입 R코드 175
VI. 이직관리
1. 이직과 이직관리 183
2. 이직에 영향을 미치는 요인 184
3. 이직 지표 186
[Case Report] 우리 회사 신입사원이 퇴사하는 이유 188
1. 문제 정의 188
2. 활용 데이터 소개 189
3. 데이터 전처리 189
4. 탐색적 분석 193
5. 사업부별 퇴사 비율의 차이 확인 197
6. 퇴사하는 사람들의 특징 199
7. 생존분석을 활용한 퇴사율 추이 분석 204
8. 핵심 인사이트 216
이직관리 R코드 218
VII. 조직문화
1. 조직문화란 227
2. 조직문화 유형 229
2.1. 경쟁가치 모형 229
2.2. 데니슨의 조직문화 모형 231
3. 하위문화 234
[Case Report] 조직문화 인식에 차이가 나는 원인 탐색 236
1. 문제 정의 236
2. 활용 데이터 소개 236
3. 데이터 전처리 237
4. 문항의 신뢰도와 타당도 분석 239
5. 구성원의 조직문화 인식 243
6. K-Means 클러스터링을 활용한 하위문화 판별 249
7. 핵심 인사이트 255
조직문화 R코드 258
VIII. 다양성관리
1. 조직에서의 다양성관리 267
2. 여성 인력과 다양성 이슈 269
3. 효과적인 여성 인력 확보 방안 270
[Case Report] 성별 다양성의 현황과 모성보호정책 사용이 승진에 미치는 영향 273
1. 문제 정의 273
2. 활용 데이터 소개 274
3. 데이터 준비 275
4. 탐색적 분석 277
5. 승진에서의 성별 격차 282
6. 모성보호제도 사용이 실적성과와 동료평가에 미치는 영향 285
7. 승진에 영향을 미치는 요인 289
8. 핵심 인사이트 294
다양성관리 R코드 296