"한빛미디어 <나는 리뷰어다>" 활동을 위해서 책을 제공받아 작성된 서평입니다.


제목 : SQL로 시작하는 데이터 분석
리뷰 요약
데이터 분석을 처음 접하는 독자들에게 배려가 아쉽지만,
어떻게 데이터를 활용해야 하는지 길을 제시하는 서적.
어느정도 데이터 분석을 알고 있는 경우 읽는것을 추천.
이 서적의 핵심
1. 데이터 분석에 사용되는 언어들과의 차이점 제시



- 대표적으로 데이터 분석에서 사용되는 이책의 주인공인 SQL과
데이터 분석에 강점이 있는 언어들인 R과 파이썬을 비교하면서
어떤 차이점이 있는지, SQL은 어떤 것인지 등에 대해 자세하게 풀어쓰면서
독자에게 어째서 데이터 분석에 SQL을 사용해야 하는지를 설명한다.
(R이나 파이썬이 나쁘다는게 아니라 왜 데이터 분석에서 많이 쓰이는지를 설명)
2. SQL을 사용하기 위해 데이터 분석에서 사용되는
데이터 타입, 데이터 종류, SQL의 문법 등을 설명하지만
'이미 어느정도 SQL을 알고있는'
개발자정도 되는 수준에서 부터 설명

- 기초 문법부터 설명하는 여타 SQL 서적과는 다르게
이미 어느정도 SQL을 할 줄 아는 개발자를 타깃으로 한 것 같다.



'SELECT문은 어떤식으로 작성해야 하는지' 등의
내용은 들어가 있지 않으며,
프로파일링, 구간화, 피벗 등
'어떤 방법으로 쿼리문을 만들지' 부터
'어떻게 쿼리문을 만들지' 등
글쓴이는 데이터를 어떻게 요리해야 하는지,
어떻게 요리하기 전 준비를 하면서 좋은 결과를 뽑아냈는지 등을
설명한다.
3. 분석하려는 데이터셋을 어떻게 활용하고
결과물을 어떻게 비교하는지를 보여줌

- 데이터베이스, SQL의 쿼리문으로 출력된 결과는 오와 열로 구성된 '표' 로써 나타난다.
어떤 데이터셋을 어떻게 활용해서 어떤 결과가 나왔는지,
시계열 그래프로 표현했을 때 어떤 결과가 출력되는지 등을 보여줌으로써
독자들이 '표'를 분석하는 시간을 낭비하지 않고 '그래프'로 쉽고 간편하게 알아볼 수 있게 한다.
하지만 쿼리 출력결과를 시계열 그래프로 표현하는 방법이나
그런 사이트를 알려줬으면 더욱 베스트가 아니었을까 싶다.
막상 쿼리문을 짜서 데이터를 출력했지만
'이걸 어떻게 저런 그래프로 표현하지?' 라는 의문을 가질 수 있을 것 같다.
4. 어떤 특정 상황에서 어떤 방법을 활용해야 하는지 설명

- 6장 '이상 탐지'에서는 데이터셋에도 오류가 있을 수 있으므로 어떻게
이상한 데이터를 구별해 낼 수 있는지를 설명하고,
9장 '결론'에서는 '장바구니 분석'과 같이 특정 상황에서 어떤식으로
분석하는것이 좋을지 설명한다.

모든 상황에 대한 대처법이 있는건 아니지만
데이터 분석 시 딱 떠올릴만한, 가장 많이 사용되는
사례들로 구성되어 있어 데이터 분석이 아니더라도
개발자가 해당 기능을 만들 때
데이터를 어떻게 활용하면 좋을지 참고해도 좋을 것 같다.
마무리
다양한 분석 방법과 문제에 대한 해결책을 알려주지만 2% 부족한 느낌의 아쉬움
1장에 쓰여있는 글을 보고 조금 의아했다.
"데이터 분석 프로젝트에 참여할 때마다 담당자에게
'데이터 분석은 정해진 날에 딱 맞춰 마무리할 수 있는 일이 아니다'라고 미리 말하곤 합니다."
...?
이게 '전문가'가 할 말인가...?
사실 기한을 정하는건 어렵다는걸 누구든 잘 안다.
언제 끝날지, 어떻게 시작해야할지 감도 안잡히는 상황일 수도 있고,
예상치 못한 돌발변수가 발생하는 상황이 있을수도 있다.
하지만 대부분의 프로젝트는 '기한'이 정해서 런칭을 하기 마련인데,
전문가가 '어느 기간까지의 데이터를 분석하겠습니다.' 도 아니고
'언제 끝날지 모르니까 알아두세요.' 라고 말한다니 조금 신뢰도가 떨어졌다.
초보자를 위한 책이 아니기 때문에
데이터셋의 활용 방법과 데이터 분석 시 해야할 것들에 대한 내용들은 좋았다.
하지만 앞 장에서 R과 파이썬을 이야기 했기 때문에 쿼리 결과를 그래프로 그릴 땐
간단하게 두 언어를 연계해서 보여주는 방법등을 활용했으면 더 좋지 않았을까 싶다.
제목이 'SQL로 시작하는' 이었기 때문에
DB에 관련된 또는 쿼리에 관련된 고급 스킬들에 대해 이야기 하지 않을까 하는 기대가 있었지만
기술의 스킬 보다는 분석 방법과 해석(?) 방법에 조금 더 초점이 맞춰져 있는 느낌이다.
DB를 어느정도 만져 본 개발자라면 예제는 그리 어렵지 않을 것이다.
개인적으론 SQL 스킬을 배우고 싶어하는 개발자보단
통계나 분석에 관심이 있는 마케터 또는
통계나 분석을 해야 하는 개발자에게 어울리는 서적이 아닐까 싶다.
'review > DEV' 카테고리의 다른 글
| 책 리뷰 : 소문난 명강의 김범준의 핸즈온 리액트 네이티브 (0) | 2024.03.28 |
|---|---|
| 책 리뷰 : 소문난 명강의 김기현의 딥러닝 부트캠프 with 파이토치 (0) | 2024.03.28 |
| 책 리뷰 : 소문난 명강의 소플의 처음 만난 리액트 (0) | 2024.03.28 |
| 책 리뷰 : 도메인 주도 개발 시작하기(DDD 핵심 개념 정리부터 구현까지) (0) | 2024.03.28 |
| 책 리뷰 : SRE with Java Microservices, 자바 마이크로서비스를 활용한 SRE (0) | 2024.03.28 |
댓글