박영사

SITEMAP
전체메뉴닫기
닫기
인공지능(AI) 도구 오렌지로 바로 실행하는 피플 애널리틱스
신간
인공지능(AI) 도구 오렌지로 바로 실행하는 피플 애널리틱스
저자
김범열, 박철용
역자
-
분야
경영학
출판사
박영스토리
발행일
2023.03.20
개정 출간예정일
페이지
320P
판형
사륙배판
ISBN
979-11-6519-384-3
부가기호
93320
강의자료다운
-
정가
25,000원

중판발행 2023.04.30

초판발행 2023.03.20


필자들은 1990년대 말 창원에서 한 사람은 현업에서, 다른 한 사람은 연구/컨설팅 분야에서 업무를 하는 입장에서 처음 만났다. 같은 그룹에 근무하면서 업무 관심사와 나이도 같았기 때문에 필자들은 쉽게 친해질 수 있었다. 이후 필자들은 평가, 보상, 직급, 조직 등 다양한 프로젝트를 같이 하면서 현업의 HR 과제 해결을 위해 노력하였고, 사석에서 만나 HR 이슈에 대해 이야기도 나누었다.

필자들이 같이 관심을 가지고 있던 분야 중에 하나가 HR 활동을 어떻게 정량적으로 분석하여 의사결정에 활용하느냐 하는 것이었다. 당시의 가장 중요한 걸림돌은 분석 도구였다. 통계 패키지로는 의미 있는 시사점을 도출해내는 데 한계가 있었다. 현업에 있었던 필자는 전문 시스템 업체를 활용해 직접 분석 알고리즘을 개발하기도 하였다. 그렇지만 분석에 활용할 수 있는 다양한 알고리즘을 개발하기가 쉽지 않았고, 범용 애플리케이션이 아니었기 때문에 트렌드 변화에 따라 다양하게 나타나는 현안 이슈에 바로 대응하고 피드백을 반영한 후속 조치를 취하는 데에도 어려움이 있었다. 필자 중 한 명은 파이썬을 몇 달 학습하기도 하였는데 원하는 분석을 할 수 있는 수준에 달하기까지는 너무 요원해 보였다. 이러한 상황에서 접하게 된 것이 바로 오렌지였다. 누구나 무료로 사용할 수 있는 오렌지를 직접 써보면서, 이 소프트웨어가 필자들이 오랜 기간 고민했던 많은 부분을 해결해줄 수 있다는 것을 알게 되었다. 

오렌지는 무료로 사용할 수 있다는 것 외에도 몇 가지 장점을 가지고 있다. 첫째, 코딩 작업이 필요 없다는 것이다. R과 파이썬 같은 도구들은 데이터 분석을 위한 프로그래밍 언어를 배우고 익히는 데 상당한 부담이 있고 많은 시간이 걸린다. 그렇기 때문에 코딩에 익숙하지 않은 HR 담당자들이 R이나 파이썬을 학습하여 피플 애널리틱스를 실행하는 것이 사실상 불가능에 가깝다. 반면, 오렌지는 메뉴, 위젯, 가상 연결 등을 활용하여 프로세스를 단순화하여 다양한 분석을 매우 용이하게 해준다. 그렇기 때문에 코딩을 전혀 모르는 사람들이 손쉽게 다가가 머신러닝에 기반한 피플 애널리틱스를 실행할 수 있다. 둘째, 예측이 가능하다는 것이다. 기존 통계 패키지는 주로 변수 간 유의적 관계가 있는지를 살펴보는 가설 검증에 중점을 둔다. 반면, 오렌지는 구체적인 숫자 또는 해리포터에 나오는 마법의 모자처럼 어느 클래스에 속하는지를 예측해준다. 따라서 조직 의사결정에 보다 의미 있는 정보를 우리에게 주는 것이 가능하다. 셋째, 숫자뿐만 아니라 텍스트 등 다양한 변수와 빅데이터를 포함한 다양한 규모의 데이터를 처리하는 것이 가능하다. 이러한 다양한 특성을 통해 오렌지는 피플 애널리틱스를 단순히 이해에서 그치는 것이 아니라, 바로 실행하여 실무에 적용할 수 있도록 도와준다.

저자들은 HR 운영 패러다임이 급격하게 바뀌고 있는 현 상황에서 감이나 관행이 아닌 팩트에 기반한 HR이 되기 위해서는 오렌지 같은 분석 툴 활용이 필수적이라고 생각하였다. 그리고 이러한 도구를 어떻게 활용하는 것이 필요한지를 소개하는 것이 HR 부문의 역량 제고에도 도움이 된다고 판단하여 이 책을 집필하게 되었다. 본 저서는 피플 애널리틱스를 실행하는 사람들이 실질적/주도적으로 분석 모델을 설정하고 데이터를 분석하여 의사결정에 의미 있는 시사점을 뽑을 수 있는 역량을 확보할 수 있도록 도움을 주는 데 그 목적이 있다. 사람과 관련한 다양한 데이터 분석을 통해, 경영진이 궁금해하는 질문에 대한 분석적이고 설득력 있는 답을 모색함으로써 인적자원 운영의 효과성을 높이고자 하는 것이다. 

본 저서는 크게 4개의 파트로 구성되어 있다. 첫 번째 파트는 피플 애널리틱스의 전반적인 개요, 필요성 및 실행 단계에 대해서 언급하였다. 두 번째 파트는 피플 애널리틱스를 실행하기 위해 이해가 필요한 핵심 사항들을 정리하였다. 본 저서의 가장 중요한 부분이라고 생각되는 세 번째 파트는 실제 데이터를 가지고 피플 애널리틱스를 실행해보는 사례로 구성되어 있다. 쉽게 따라할 수 있도록 단계별로 오렌지를 작동하는 방법과 의미를 설명하였다. 마지막 네 번째 파트는 향후 피플 애널리틱스의 과제에 대해 간략하게 이야기하고 있다.


책을 쓰는 사람들은 같은 마음이겠지만 필자들도 독자들이 이해하기 쉽도록 쓰기 위해 노력하였다. 그렇지 못한 부분이 있다면 이는 전적으로 필자들의 잘못이다. 그렇지만 본서에 나와있는 내용을 이해하고 사례들을 하나씩 따라하면서 자기 것으로 만든다면 여러분들은 분명 피플 애널리틱스 전문가로서 한 걸음 더 다가갔다고 할 수 있다. 물론 피플 애널리틱스의 전문가로 자리매김하기 위해서는 본서에서 다룬 사례 외 다양한 데이터를 가지고 직접 실행해보면서 활용 역량과 통찰력을 키우는 노력이 필요하다. 여기에서 미처 다루지 못한 사례나 내용들은 다시 기회가 되면 소개하도록 하겠다. 


김범열

연세대학교에서 경영학 학사/석사/박사 학위를 받았다. LG경제연구원(현 경영연구원)에서 30년 넘게 주요 기업 조직설계, 평가/보상 시스템 구축, R&D 운영 체계 수립, 기업 비전 및 조직문화 구축 등 조직 운영의 효과성 제고를 위한 다양한 프로젝트 및 연구를 수행하였다. 또한 LG인화원 MBA HR 과정, 신임 임원 과정 등 다양한 과정에서 강의 수행과 기고 활동도 하였다. 인사혁신처 자체평가위원회/정책자문위원회 위원, 국가과학기술심의회 기초기반전문위원회 위원, 다목적 방사광가속기 구축사업 추진위원회 위원 등을 역임하였다. 현재는 퇴직하여 관심 있는 이슈에 대해 읽고 쓰는 일을 하고 있다.


박철용

미국 DREXEL 대학에서 Engineering Management 석사를 마치고, LG에 입사하여 반도체/전자/이노텍/인화원에서 30여 년간 HR 실무를 수행했다. 특히, LG전자와 이노텍에서 CHO 역할을 하면서 창의/자율적 조직 문화 형성을 위한 직급 체계 간소화, 성과 중심의 평가/보상 체계 구축, 우수인재 확보 및 육성을 위한 채용/교육 프로세스 설계, Global HR System 구축 등 회사 HR 활동 전반을 이끌었다. 현재는 LG인화원에서 전무로 근무하면서 HRD Innovation 업무를 수행 중이다. 


들어가기 전에

사례 데이터 활용 방법


PART 01 인공지능과 HR의 연계:피플 애널리틱스

01 HR 의사결정, 분석이냐 직관이냐? 3

02 왜 지금 피플 애널리틱스인가? 10

03 피플 애널리틱스의 실행 단계 20


PART 02 피플 애널리틱스 실행을 위해알아야 할 것들

01 인공지능은 어떻게 일을 하는가? 31

02 인공지능이 잘 해결할 수 있는 영역은? 40

03 인공지능이 일을 잘했다는 것을 어떻게 알 수 있을까? 46

04 인공지능에서 활용하는 알고리즘은? 54

05 인공지능 모델의 성능을 어떻게 고도화할까? 69


PART 03 AI 도구 오렌지(Orange)를 활용한 분석 실행하기

오렌지 설치하기 83

사례 1 퇴직자 예측: 누가 왜 회사를 떠나는가? 86

사례 2 HR과 조직 성과: HR을 잘하면 성과가 좋을까? 146

사례 3 구성원 개인에게 적합한 교육 과정은? 183

사례 4 우리의 채용 대상자는 누구인가? 219

사례 5 Kaggle Competitions: 타이타닉, 주택 가격 250


PART 04 피플 애널리틱스의 미래 과제

01 데이터와 친해지기 295

02 향후 피플 애널리틱스 실행의 주요 포인트 300


참고 사이트 및 자료 304

사례 데이터 활용 방법

사례에 사용되는 데이터 파일은 출판사 홈페이지(www.pybook.co.kr) 도서자료실에서 다운로드할 수 있다.

사례에 활용할 파일은 사례별 폴더로 나뉘어져 있다. 사례 데이터의 구성은 다음과 같다.


● 사례 1 폴더

train: 퇴직자 파악을 위한 학습 데이터

test: 향후 퇴직자 예측을 위한 테스트 데이터

train_Involvement: 재직자 직무 몰입 분석을 위한 데이터


● 사례 2 폴더

Case2_Analysis_Basic: HRM과 조직 성과 관계 파악을 위한 학습 데이터

Case2_Analysis_Test: HRM을 통한 조직 성과 예측을 위한 테스트 데이터

Case2_Analysis_prediction: 예측치와 실제치의 오차 분석 결과


● 사례 3 폴더

employee_course_ratings: 구성원 ID, 과목 ID, 구성원 평가 점수 등의 데이터  

course_names: 과목 ID와 과목명 데이터

employee_names: 구성원 ID, 구성원 이름 데이터

Popular_Course_Deriving: 인기 과목 도출을 위한 코딩 내용

Index_Adjusting: 인덱스 조정을 위한 코딩 내용


● 사례 4 폴더

aug_train: 채용 대상자 파악을 위한 학습 데이터

aug_test: 채용 데이터 예측을 위한 테스트 데이터  


● 사례 5 폴더: 1_타이타닉

train: 생존자 파악을 위한 학습 데이터

train_cabin_regroup: train 데이터 중 cabin 변수를 조정한 데이터

test: 생존자 예측 시 활용할 테스트 데이터 

test_cabin_regroup: test 데이터 중 cabin 변수를 조정한 데이터

gender_submission: 예측한 결과의 제출 형식을 보여주는 파일  


● 사례 5 폴더: 2_주택가격

train: 주택가격 예측을 위한 학습 데이터

train_Modify: train 데이터의 결측값 형식을 바꾼 데이터

test: 주택가격 예측할 때 활용하는 테스트 데이터

test_Modify: test 데이터의 결측값 형식을 바꾼 데이터

sample_submission: 예측한 결과의 제출 형식을 보여주는 파일

data_description: 변수의 의미를 설명하는 텍스트 파일