▶ 이 책은 데이터 사이언스에 대해 다룬 이론서입니다. 데이터 사이언스의 기초적이고 전반적인 내용을 학습할 수 있도록 구성했습니다.
데이터 사이언스의 의미부터 금융 데이터 분석, 동적 시스템 분석 등의 공학 응용까지를 파이썬으로 실제로 분석하면서 학습할 수 있다. 특히 데이터 처리와 확률·통계 기초와 같은 기본적인 부분부터 회귀분석, 패턴 인식, 딥러닝 등 통계·머신러닝 기법, 금융 데이터 등 시시각각 변하는 시계열 데이터 분석, 센서 데이터 등에 포함된 노이즈나 외란을 판별하는 스펙트럼 분석, 노이즈나 외란을 제거하기 위한 디지털 필터, 이미지 데이터의 분석으로 이미지 처리를 설명함으로써 데이터 과학의 개략적 내용을 한눈에 파악할 수 있다.
통계학을 진지하게 공부하고자 하는 미래의 통계학자, 데이터 사이언티스트, 빅데이터 분석가, 인공지능 전문가, 각 분야의 애널리스트를 위하여 만들어진 통계학 입문서다. 컴퓨터를 활용하지 못하는 통계학은 실용적이지 못하며,통계이론에 대한 지식이 없는 통계학은 사상누각에 불가하다. 따라서 통계이론에 대한 개념을 소개하고, 수학적으로 접근하여 논리성을 설명한 후, R 프로그래밍을 통하여 확인하는 방법으로 모든 주제를 접근하였다.
인터넷이 고도로 발전한 오늘날, 우리는 알게 모르게 다양한 데이터에 둘러싸여서 일상생활을 보내고 있다. 이런 사회를 책에서는 ‘데이터화 사회’라 칭하고 있지만, 이는 데이터가 없으면 흔한 일상생활을 보내기 어렵다는 것을 의미한다. 이처럼 현대 사회에서는 ‘데이터’의 가치가 올라가고 있기에 데이터를 다루는 과학이 생기는 것은 당연한 일이며, 이러한 과학을 데이터 사이언스라고 한다. 우리가 알아야 할 데이터 사이언스의 기본 개요와 사고방식을 쉽게 설명하기 위해 책에 일러스트와 도표를 적극적으로 활용하였다. 어려운 수식 없이 이해할 수 있도록 만들었기 때문에 데이터 사이언스에 입문하고자 한다면, 이 책으로 시작하길 권한다.
래피드마이너 스튜디오(RapidMiner Studio)를 활용하여 데이터사이언스에 대한 기본 지식을 습득할 수 있도록 구성하였다. 래피드마이너 분석프로세스는 프로그램 작성이나 코딩을 할 필요 없이 여러 오퍼레이터들의 조합이 그림으로 표현되어 사용자가 수월하게 결과를 얻을 수 있으며, 또 다양한 유형의 데이터에의 접근이 수월하다는 강점을 지니고 있다.