박영사

SITEMAP
전체메뉴닫기
닫기
AI와 데이터분석 기초
신간
AI와 데이터분석 기초
저자
윤상혁, 양지훈
역자
-
분야
경영학 ▷ 경영통계
출판사
박영사
발행일
2021.02.25
개정 출간예정일
페이지
328P
판형
크라운판
ISBN
979-11-303-1231-6
부가기호
93320
강의자료다운
정가
22,000원

초판발행 2021.02.25


이 책은 저자가 실무와 다양한 연구 과정에서 부딪히며 깨달은 경험과 시행착오를 바탕으로, AI(인공지능)에 대한 지식과 이를 활용한 실무 데이터 분석을 비전공자들의 언어와 눈높이에 맞춰 써 내려간 입문서이다.

AI 시대, AI와 데이터 분석을 알아야 하는 이유
디지털 비즈니스 환경에서 AI의 진화와 적용은 두드러지게 나타나고 있으며, AI는 우리 삶 속에 이미 깊숙이 들어와 있다. 스트리밍으로 음악을 들을 때도, 넷플릭스에서 영화를 볼 때도, 인터넷에서 쇼핑을 할 때도 우리는 AI의 추천에 의지하고 있다. 그뿐만 아니라 AI는 전문 트레이더보다 더 정확한 주식추천에 이용되고 있고, 변호사를 대신하여 계약서를 검토하고 있으며, 기자를 대신해서 포털의 기사를 쓰고 있기도 하다. AI는 모든 산업에 적용되어 우리의 삶을 바꾸고 있다. 이제 AI를 활용하는 것이 직장이나 본인의 사업을 하는 데 유리해지는 정도가 아니라, 새로운 비즈니스를 만들고 이를 관리 및 운영하는 데 필수적인 요소가 되고 있다. 또, 변호사, 번역가, 기자, 심지어는 미술이나 음악 같은 창작자까지, 기존에는 인간만이 할 수 있었던 작업을 AI가 대체할 수 있게 되면서 인간의 직업을 위협하는 생존 문제까지 거론되고 있다. 인터넷이 개발되고 우리의 삶과 비즈니스에 적용되어 사회·문화·경제를 변화시켰듯이, 그리고 스마트폰이 개발되고 적용되어 애플리케이션 시장이 산업생태계를 흔들었던 것처럼, 새로운 혁신 기술의 도입과 적용은 전 세계에 동시다발적인 변화를 유도하고 있으며 그 변화의 주기는 더 짧아지고 있다. 그리고 전문가들은 이제 AI를 향후 변화의 핵심으로 주목하고 있다. 이렇게 급변하는 상황에서 우리는 무엇을 준비하고 어떻게 대비해야 할까?

모두가 AI 개발자, 프로그래머가 될 필요는 없다?
AI에 대해 언론을 통해 많이 접했고 그 중요성도 이미 알고 있지만, AI가 무엇인지 정확히 알지 못하는 사람들은 막연한 두려움만이 있을지도 모르겠다. 하지만 확실한 것은 모두가 AI 개발자 또는 프로그래머가 될 필요는 없다는 것이다. 예를 들어, 스마트 기기를 활용한 애플리케이션 시장이 활발해졌다고 해서 모든 사람이 애플리케이션 개발자가 될 필요는 없었다. 다만 모바일이라는 환경을 활용한 애플리케이션 시장이 어떤 것인지 알고 이를 활용해 내 영역에서 적용할 수 있는 것은 무엇인지 찾는 과정이 비즈니스나 실무에서 매우 중요했다. 마찬가지로 이제는 AI가 무엇이고 기본적으로 어떻게 구동되는지 아는 것은 매우 중요하다. 하지만 AI 개발자를 제외한 비전공자들이 AI 관련 이론이나 공식, 계산과정, 작동원리 등을 세부적으로 알 필요는 없을 것이다. 그보다 AI가 기본적으로 어떤 것인지 이해하고 이를 활용한 데이터 분석을 내가 있는 영역에서 실무적으로 딱 활용할 정도의 지식과 실무능력을 요구받고 있다.

경험을 통해 깨달은, 쉽게 이해하고 터득하는 AI와 데이터 분석
필자는 학창시절 수학을 피해서 인문계에 진학하였으며 대학원에 진학하기 전까지 숫자와는 거리가 멀었던 문과생이었다. 그래서 흥미보다는 필요 때문에 접근하고 졸업하기 위해 공부한 AI와 데이터 분석 습득과정은 절대 만만치 않은 과정이었다. 프로그래밍과 코딩에서부터 통계에 이르기까지 이전의 사고방식과 뇌 구조에서는 이해하기 어려운 한계를 경험하기도 하였다. 그래서 이러한 험난했던 시행착오 경험과 습득과정에서의 비결을 최대한 살려 문과생이나 비전공자 시각에서도 쉽게 배울 수 있는 안내서를 만들고자 하였다. 특히 실무나 활용, 이해 차원에서 필요 없는 내용은 최대한 제외하여 핵심적으로 꼭 알아야만 하는 내용을 중심으로 최대한 부담이 없도록 내용을 구성하려 노력하였다. 그래서 독자들이 막연한 두려움을 극복하고, 저자가 겪었던 어려움의 과정 없이 AI를 쉽게 이해하여 각자의 분야에서 AI 기반 데이터 분석을 활용했으면 하는 바람이다.
비전공자에게 인공지능과 프로그래밍 기반 데이터 분석을 가르친다고 했을 때, 많은 선배 교수님들이 학생들이 잘 따라갈 수 있을지 걱정을 하셨다. 그리고 지난 몇 년 동안 학생들을 가르쳐 본 후 비전공자도 충분히 잘 배울 수 있다는 확신이 생겼다. 오히려 비전공자들은 편견이나 선입견 없이 내용을 잘 흡수하고, 배운 기술을 잘 응용하여 새로운 분야에 더 잘 접목하는 것을 눈으로 확인했다. 걱정을 기우로 만들어준 동국대학교 광고홍보학과 학생들에게 고마움을 전한다. 아무쪼록, 이 책이 AI로 촉발된 디지털 비즈니스의 변화 속에서 생존전략을 세우는 데 조금이나마 도움이 되길 희망한다.

윤상혁
KAIST 정보경영 석사, 연세대학교 정보시스템 박사학위를 취득한 후, 기술 기반 광고회사인 스마트미디어렙(SMR)에서 데이터 과학자로 활동 중이다. 주요 연구 분야는 디지털 마케팅, OTT 서비스, 머신러닝, 비즈니스 애널리틱스 등이다. 동국대학교 겸임교수로 재직 중이며, 광고홍보학과 학생을 대상으로 광고데이터 애널리틱스 수업 등을 맡고 있다. 관련 연구들은 SSCI, SCOPUS 논문을 포함해 약 10여 편의 논문이 게재되었다. 저서로 ≪소설 혁명 TV≫(2012), ≪디자인씽킹을 넘어 프로그래밍씽킹으로: 코드 한 줄 없이 배우는 코딩≫(2021)이 있다.

양지훈
한국문화관광연구원 문화산업연구센터 연구원이다. 연세대학교에서 정보시스템학 박사를 수료하였고, 한국방송통신전파진흥원 선임연구원 등을 거치면서 디지털 비즈니스 및 콘텐츠 산업 분야 40여 개의 정부 연구프로젝트에서 연구책임 등으로 폭넓은 연구를 진행하였다. 웹툰, OTT, e스포츠, VR, CT R&D 등 콘텐츠 산업 전반에 걸친 다양한 주제의 논문들을 국내외 학술지에 게재하였으며 저서로는 ≪4차산업혁명 시대, 만화와 기술의 융합≫(2019), ≪언택트와 콘텐츠≫(2021)가 있다.

PART 1 AI와 디지털 비즈니스의 이해
1. AI는 무엇이고 왜 중요한가? 3
1) AI 시대의 도래 3
2) AI의 특징 8
3) AI의 비즈니스 활용 14
4) 분야별 AI 활용 사례  18
2. 비즈니스 패러다임의 변화 24
1) 4차 산업혁명 24
2) 디지털 트랜스포메이션 27
3) 디지털 플랫폼 30
3. 디지털 비즈니스 개요 34
1) 디지털 비즈니스의 이해 34
2) 디지털 비즈니스의 등장 배경 37
3) 디지털 비즈니스의 효과 40
4) 디지털 비즈니스의 융합을 통한 가치 창출 효과 42
5) 디지털 비즈니스 종류 44
4. 디지털 비즈니스에서 데이터의 중요성 47
1) 데이터 경제 시대로의 전환 47
2) 데이터의 개념과 특징 50
3) 데이터 비즈니스의 특성 53

PART 2 디지털 비즈니스와 과학적 분석
1. 디지털 비즈니스와 데이터 과학 59
1) 데이터 과학과 마케팅 59
2) 마케팅 과학과 데이터  61
3) 마케팅 과학의 문제해결 과정 66
2. 데이터 과학과 머신 러닝 70
1) 데이터 분석 기초 70
2) 빅데이터 73
3) 머신러닝 78
4) 머신러닝 모형의 분류 78
5) 머신러닝 과정 79

PART 3 통계적 가설검증의 이해
1. 가설 검정의 이해와 검정 통계량의 의미 87
1) 데이터 분석을 위한 통계 기초 87
2) 가설과 가설 검정 90
2. 빈도와 중심화 경향 95
3. 통계분석 방법 99
1) 상관관계 분석(Correlation analysis) 99
2) 군집 분석(Cluster analysis) 104
3) 회귀 분석(Regression analysis) 108

PART 4 데이터 시각화
1. 데이터 시각화란? 115
2. 데이터 시각화 작성 순서와 도구 117
3. 차트 종류 121
1) 막대그래프 121
2) 누적 막대그래프 123
3) 선형 그래프 124
4) 원형 차트 125
5) 산점도 125
6) 폭포형 그래프 126
7) 트리맵 그래프 127
8) 시각화 방법 선택하는 방법 127
4. 데이터 시각화 기본요소 129
1) 숫자 129
2) 글자 133
3) 색깔 134
4) 차트 요소 139
5. 차트 종류별 작성원칙 140
1) 세로막대 그래프 작성원칙 140
2) 가로막대 그래프 작성원칙 143
3) 선형 그래프 작성원칙 145
4) 원형 차트 작성원칙 147
6. 데이터 시각화를 활용한 분석기법 150
1) 퍼널 분석 150
2) 코호트 분석 154

PART 5 프로그래밍 기초
1. 프로그래밍과 파이썬 159
2. 비전공자도 프로그래밍을 배워야 하는 이유 161
3. 실습환경 구성하기 163
1) 구글 코랩 환경 설정하기 164
2) 구글 코랩 둘러보기 168
3) 셀의 종류(코드와 텍스트) 169
4) 주요 단축키 171
4. 프로그래밍 연산 172
5. 기초 문법 173
1) 변수 173
2) 데이터 타입 174
6. 조건문 181
1) 비교 연산자 182
2) 들여쓰기(indent) 183
3) 논리 연산자 185
7. 반복문 187
8. 함수와 라이브러리 192
1) 내장함수 192
2) 라이브러리 194

PART 6 프로그래밍 기반 데이터 전처리
1. 데이터 이해하기: 판다스 199
2. 데이터 불러오는 방법 202
3. 기술 통계 및 정렬 205
1) 데이터 기본 정보 살펴보기 205
2) 기술 통계와 데이터 형태 208
3) head와 tail 209
4) 데이터 정렬하기 210
4. 데이터 선택하기 213
1) index를 활용한 범위 선택 213
2) iloc으로 행과 열 범위 선택 214
3) 컬럼명을 활용하는 loc 215
4) 조건을 추가해서 데이터 불러오기 216
5. 데이터 처리하기 218
1) DataFrame 복사: copy 218
2) 행열 추가 및 삭제 219
3) 그룹으로 묶어보기: Groupby 223
4) reset_index 225
6. 결측값과 중복값 처리 227
1) 결측값 처리 227
2) 중복값 처리 231
7. 문자 데이터 처리 235
1) 날짜 타입으로 변경하기 235
2) 텍스트를 코드값으로 변경하기 239
3) 원핫 인코딩 242

PART 7 프로그래밍 기반 데이터 시각화와 실전 분석
1. 데이터 시각화: 판다스 라이브러리  247
1) 시각화를 위한 기본 환경설정 247
2) 선 그래프 249
3) 막대그래프 251
4) 원형 차트 255
5) 산점도 256
6) 그 외 데이터 시각화 257
2. 데이터 시각화: matplotlib과 seaborn 라이브러리 258
1) 시각화 관련 다양한 기능 제공 258
2) seaborn에서 제공하는 통계기반 시각화 264
3. 예측 마케팅 267
1) 문제 정의 267
2) 데이터 설명 268
3) 데이터 탐색 269
4) 데이터 분석 274
5) 적용방안 276
4. A/B Test 마케팅 277
1) 문제 정의 277
2) 데이터 설명 278
3) 데이터 탐색 279
4) 데이터 분석 284
5) 적용방안 286
5. 군집 마케팅 287
1) 문제 정의 287
2) 데이터 설명 288
3) 데이터 탐색 288
4) 데이터 분석 295
5) 적용방안 299

부록 AutoML 따라해 보기