본문 바로가기
review/DEV

책 리뷰 : 데이터 전처리 대전

by ㅇㄱㅈㄱ 2024. 2. 2.
728x90
반응형

[한빛미디어 '나는 리뷰어다' 11월 이벤트 당첨 도서 리뷰입니다]


요약

- SQL 중심의 설명(SQL이 뭔지 모른다면 읽기 힘들듯, 파이썬도 나옴)

- '데이터'라 하면 그래프나 차트, 그리드등이 많이 나올것 같지만 아쉽게도 많이 나오지 않음

- 생각보다 재미난 서적, 관심이 없어도 데이터 처리에 관해 한번쯤을 읽어보면 좋을듯


오늘 리뷰할 책은 바로

두 - 둥 - !

이미지만 봐도 머리가 아프다...

데이터를 어떻게 다뤄야 잘 다뤘다고 소문이 날수 있는지 알려주는 책인것이다!

 

막 수학을 다룰것 같고 머리가 아파오기 시작한다.

수학은 별로 안좋아한다.

외우기 어려운 공식 써가면서 해결책을 찾아야 한다는게...

싫다...! 싫어!

 

잡담은 이만하고 이 책을 한번 쭉 훑어본 감상은

오... 재미있는데? 였다.

 

읭? 머리아플것 같고 그렇다며?

음... 출판사에서 일부러 훼이크를 준거 아닐까? ㅎㅎ

어려워 보이지?지만 사실 재미있는거지롱~? 같은 느낌...!

 

누구를 위한 책인가?

이 책의 초반부에 설명하고 있는 대상 독자는

"간단한 프로그래밍을 할 수 있는" 이라고 정의하고 있다.

그러니까 뭐 수학이 어떻고...

이런건 그냥 헛소리란 거다 ㅎㅎ

 

어떤 언어를 사용할까?

현재 데이터를 다룰때 가장 많이 사용되는 언어는

위의 사진에 나오는 것처럼 세가지가 있다.

SQL

R

PYTHON

 

이 책에서는 파이썬과 SQL이 '주' 이다.

R이 나오는건 아직 자세하게 보지 않아서 모르겠다.

 

솔직히 프로그래머라면 SQL을 주로 다루게 되니 파이썬을 잘 모르더라도

충분히 읽을수 있다고 생각한다.

ORACLE, mariaDB 등 어떤 특정 데이터베이스를 정한게 아니기 때문에

특정 DB에서 호환되는 문법을 사용하지 않고 스탠다드 SQL을 사용하는것 같다.

 

막 바로 실전으로 투입하는게 아니라

지도학습과 같은 데이터 처리를 위한 방법들에 대해 간략하게 설명해준다.

머신러닝을 잠깐이라도 접해봤다면

반가운 느낌이 들지 않을까!

 

SQL 정의 부터 자세하게 설명형식으로 진행하기 때문에

"나는 프로그래머지만 SQL을 잘 모른다..."

하는 분들도 조금만 공부한다면 잘 따라올수 있을것 같다.

(CREATE DATABASE는 안나온 것 같은데 설마 모르는 분들이 있을까..?)

 

직접 실행하고 어떤 결과가 나오는지 출력 결과를 넣어놓음

 

후반부에는 그래프도 쓰고 그럴것 같았지만

딱히 그런건 없는것 같았다.

 

파이썬을 활용했으니 그래프 같은것도 사용했으면

좀 더 시선을 끌수 있지 않았을까!

하는 생각도 해본다.

 

책을 받아보고 하나씩 따라해보고 있는데

확실히 데이터의 변화를 바로바로 볼수 있으니

직접 해보는 재미가 있다.

 

전처리,

[어떤 조작을 하기 전에, 그 조작에 알맞는 상태로 준비해 두는 것]

 

4차 산업혁명이라는 세상에 들어서면서

모든것은 '데이터의 싸움' 이라고 생각한다.

여러 분야에서 쓰이는 빅데이터나 머신러닝등

가장 핫한 분야에서도 데이터가 없다면 무용지물이 아닌가!

 

데이터 핸들링을 필요로 하는 사람들이라면

읽어보길 추천한다.

728x90
반응형

댓글