반응형
1. 평점
3/5점 (⭐️⭐️⭐️☆☆)
"데이터 분석이 궁금한 일반인들에게 추천"
"이미 데이터 분석에 입문한 사람들에겐 비추"
2. 이런 책이었다.
'데이터 분석'이란 무엇인가에 대해 일반인들도 쉽게 그 개념과 현황을 캐치할 수 있도록
나이스지니데이타(NICE평가정보의 자회사)라는 빅데이터 컨설팅 기업에서 발간한 책이다.
3. 후기
요즘 핫한 '데이터 분석'이라는 게 뭐고 어떻게 하는 건지 궁금한 사람들이라면
grap-and-go 하기 좋은 책이다. 그만큼 쉽게 설명하고 그림이나 차트가 많아 가볍게 읽기에 좋았다.
본인에게 이 책에서의 수확은 한 가지였다.
요즘 데이터분석은 머신러닝이나 딥러닝이 거의 필수인데 이 책에서는 잘 해놓은 전처리가 머신러닝이나 딥러닝의 기교보다도,
올바른 전처리를 하는 것이 제작하려는 예측모델의 성능을 10% 이상 향상시킬 수 있다는 점이었다.
(머신러닝과 딥러닝은 예측모델의 정확도를 높이는 것이 주 목적이고 이를 통해 드라마틱한 성능(정확도) 향상은 잘 이루어지지 않는다.)
4. 기억에 남는 메시지
- 실제 도메인 지식에 기반한 전처리는 훨씬 복잡하며 많은 시간이 요구되는 작업이다.
- 데이터 분석의 8할(80%)은 데이터 전처리에 소모된다.
- 데이터 분석 프로젝트를 수행하다보면 극적인 성능 향상이나 통찰력 있는 분석은 알고리즘의 선택도, 하이퍼 파라미터의 튜닝도 아닌 효율적인 전처리에서 나오는 경우가 많다.
- 알고리즘을 열심히 고민해서 1, 2%의 성능(예측모델의 정확도)을 올리는 것보다 도메인 지식에 기반해 효율적인 전처리를 진행할 때 10% 이상의 성능 향상을 가져오기도 한다.
- 다시 한번 강조하지만 도메인에 대한 충분한 지식이 우선이다.
- 업무 프로세스의 이해 없이는 딥러닝이든 머신러닝이든 그저 현실에 어떤 울림도 주기 힘든 숫자놀이일 뿐이다.
0123
반응형
'📝 3분 독후감(Book Report in 3 mins)' 카테고리의 다른 글
3분 책 리뷰 - "데이터 읽기의 기술" (0) | 2024.04.11 |
---|---|
3분 책 리뷰 - "데이터 쓰기의 기술" (0) | 2024.04.02 |
3분 책 리뷰 - "분석 전문가가 말하는 빅데이터" (2) | 2024.02.13 |
느리게 더 느리게 2 : 베이징대 인생철학 명강의 (0) | 2014.08.29 |