[교육&스터디]/[패스트 캠퍼스] 데이터 분석 부트캠프 9기

[데이터 분석 부트캠프] 8주차 진행 및 학습일지

icepack788 2023. 8. 24. 18:39

[패스트 캠퍼스] 데이터 분석 부트캠프 8주차!! 

 

길고 길고 길었던 2번째 미니 프로젝트인, SQL 미니 프로젝트가 끝나고 이번주차부터는 새로운 Tool인 태블로를 학습해보았습니다~!! 난생 처음 들어보는 Tool이였는데요~ 과연 어떤 내용을 담고 있는지 한번 알아보죠~!!

추가로 SQL 미니 프로젝트는 정말 어렵고 난관의 연속이였습니다 ㅎㅎ 이번주 화요일까지 SQL 미니 프로젝트를 진행하여 태블로 수업은 하루밖에 나가지 않아서 내용이 많이 없었는데요~ 되게 신기하고 직관적이고 가시적인 Tool 인 것 같습니다 ㅎㅎ 하지만 안으로 파고 들 수록 생각보다 복잡? 할 수도 있는 내용이여서 요 파트도 어떻게 프로젝트를 진행할지 기대 반 걱정 반 인 것 같습니다. 프로젝트 관련 내용은 따로 회고& 피드백으로 돌아올께요~!! 


[8주차 : 태블로 학습 및 정리 내용] 

1. 태블로의 구성

- 데이터 준비 : 태블로 프랩
- 화면 제작 : 태블로 데스크탑 프로 or 퍼블릭
- 결과 공유 : 태블로 서버/온라인, 태블로 퍼블릭, 태블로 리더(아크로뱃 리더)

2. 데스크탑 VS 퍼블릭
- 데스크탑은 기본적으로 유료 vs 퍼블릭은 무료
- 데스크탑은 개인 pc에 저장 가능 vs 퍼블릭은 온라인 저장만 가능
- 데스크탑은 모든 서버에서 가능 vs 퍼블릭은 서버 데이터 접속 불가

3. 태블로의 핵심개념
- 차원과 측정값
- 측정값(measure) : 우리의 관심을 받는 대상 그 자체
ex)  ‘키’ 분석
ex) 여행지에 대한 ‘SNS 언급량'
ex) 회사의 ‘고객의 수’, ‘매출액’ 등
- 차원(dimesion) : 관심을 가지고 있는 측정값을 어떻게 나누어볼 것인가(썰어서, 슬라이싱)
ex) 남자와 여자 즉, 성별을 기준으로 키를 분석
ex) 17개 광역지자체 분류에 따라 SNS 언급량 분석
ex) 매출액을 월별로 검토
→ SQL의 Group by 뒤에 나오는 것들이라고 생각하면 이해하기 쉬움
→ 측정값을 썰어보는 기준 or 관점
→ 빵, 떡, 그리고 쿠키 커터 : 빵 and 떡 = 측정값, 그것을 어떻게 찍어낼지 모양에 따라 다른 쿠키 키터 = 차원 이라고 할 수 있음

4. 태블로 제품 구성(생태계)과 시스템 

1) 태블로 제품 구성(생태계)연속형과 불연속형의 정의
- 연속형은 쭉 이어진 것, 불연속형은 잘려서 구분되는 것
- 연속형이 화면(시트)에 올라갈때는 초록색 알약(영문 표기 pill)로 표시 ↔ 불연속형은 파란색
- 측정값은 ‘항상’ 연속형이 아니며, 차원도 ‘항상’ 불연속형이 아니다!!

2) Level of Detail or View Level of Detail (VLOD)
- 태블로가 작동하는 근본 원리이자, 모든 논의의 기초가 되는 중요한 개념
- 태블로는 집계한다 : 집계는 나열된 숫자들을 한데 모아서 연산하다는 의미, 태블로는 그렇게 집계된 값을 항상 보여줌. Raw datd 값을 그대로 반환하지 않고 집계값을 보여줌(프로그램을 그렇게 만듬)
- 태블로는 항상 덩어리로 보여주기 때문에, 우리가 원하는 관점 즉 차원으로 슬라이싱해서 볼줄 알아야함.
- 태블로를 ‘슬라이스의 예술(?)’이라고 부른다면, 얼마나 두껍게, 거칠게, 잘게 썰 것인가에 대한 선택이 가능. 이것을 LOD라고 부름.
(1) more aggragated = less granular = less detailed
(2) less aggragated = more grannular = more detailed
- LOD는 오직 차원만이 LOD를 결정한다!!, 화면이 어떤 레벨로 슬라이싱 되어있는지 파악하는게 중요함
- 현재 visualization에는 없는 차원의 집계 할 수 있다!!

- 현재 수준이 아닌 본인이 원하는 수준에서의 계산 할 수 있는 강력한 기능
- FIXED, INCLUDE, EXCLUDE
- 활용 예시: 재구매 여부, 신규 구매 고객 분석, 사용자별 분석, 고객 유지 패턴 분석
- Syntax: {FIXED <차원선언> : <집계식>}
- FIXED: 특정 차원 사용 계산
- INCLUDE: 현재 VIEW와 관계 없이 특정 차원 추가하여 계산

5) 네 가지 계산
- 태블로에서 계산된 필드 사용시에 곱셉, 나눗셈은 사용을 굉장히 주의해야함
ex) profit / sales 그냥 이렇게 해버리면 Row 레벨에서 행 단위로 모든 것을 나누고 그것을 집계(합계, 태블로의 특성상) 보여주기 때문에 엉뚱한 값을 보여주는 경우가 많음
- 그렇기에 위와 같은 값을 보고 싶으면 sum(profit) / sum(sales)를 해주는 것이 좋음. 또는 괄호를 잘 활용해야함

6) 시트, 대시보드, 그리고 스토리
- 가장 중요한 정보는 관습적으로 좌상단부터 표시하는 순서가 있음. 연도-월-일-고객정보로 위에서부터 아래로 내려가는 것이 보통의 대시보드라고 할 수 있음
- 바둑판식 vs 부동(장단점을 중심으로)

- 비즈니스 대시보드에서 부동 방식을 추천하지는 x → 바둑판 추천
- 바둑판식 : 공간을 채워가는 개념
- 컨테이너: 물건들을 집어넣는 공간. 대시보드에 넣어 준 뒤 그 안에 텍스트나 시트, 이미지 등을 넣는 방식으로 활용함.
- 컨테이너 내 시트들의 크기/위치를 맞추거나 텍스트/이미지를 넣는 데에 유용


- 이후에는 패스트캠퍼스 측에서 제공하는 데이터셋으로 그래프를 만들어보았습니다. 

1. 연도별 profit을 사각형 막대 그래프로 표현 

2. 연도를 분기로 잘라서 분기별 Profit을 구하는 막대 그래프 생성 

3. 연도를 월별로 잘라서 사각형 막대 그래프로 표현, 여기서는 특별하게 index를 사용해서 세로로 1분기를 표현했음.

4. 연도를 이제 연속형으로 전환하고 일자별로 슬라이싱. 그것에 맞는 라인 그래프를 선정하여 실습 진행.

5.  만든 자료들을 종합하여 대시보드를 생성 

 


오늘은 여기까지입니다!! 태블로는 뭔가 이론적인 내용보다는 실습적인 부분이 많은데, 모든게 사실 저작권 내용이 많다보니 온라인 상에서는 공유가 어렵네요 ㅠㅠ(위의 자료도 언제 없어질지 모름,,) 최대한 안걸리게? 해놓았지만 어떻게 될지 모르겠네요~ㅎㅎ 그리고 이제 거의 BDA 9기도 2/3이상이 진행되어가고 있습니다~~~~ 

이제 태블로 프로젝트 & 파이널 프로젝트만 남아있네용 ㅎㅎ 슬슬 몇명씩 안보이기도 하지만,, 끝까지!! (물론 그 전에 취업하면 더 좋음) 잘 완수해보고 수료 이후에 찐 리얼후기로 돌아도록 하겠습니다~!! 

먼저 떠나간 이여 Adios!

반응형