[1주차 내용 정리]
데이터 분석의 정의
1) 데이터 분석이란?
: 의사결정을 지원하는 것을 목표, 의사 결정을 더 과학적으로 만들어주고, 비즈니스를 더 효율적으로 운영할 수 있도록 도와주는 역할.
- 현실과 이상 사이의 GAP을 우리는 '문제'라고 부름. 데이터 분석이란 과거 데이터를 분석해 현실의 문제를 해결 할 수 있는 방법을 모색. 문제 = 지금 발생하고 있는 현상, 문제를 정의한다는건 지금 우리가 어디있는지, 어디가 안좋은지를 정의내리는 것.
- '데이터 분석'은 현실에 살고 있는 우리를 더 나은 미래로 나아가게 하는 key
- 데이터 분석의 목적과 과정 : '인사이트 도출' (교훈이라고 생각하면 편함)
- 단순한 해결책이 아니라, 어디로 나아갈 수 있는지, 어디로 가야 더 좋아질지 방향성에 대한 것을 제시하는 것이 인사이트 도출임. 교훈을 객관적이고, 과학적으로 도출할 수 있는지에 대한 것이 바로 '데이터 분석'
1. 우리는 왜 엑셀을 배워야 할까?
- 조직적인 관점에서의 이유 : 기업에서 많이 쓰기 때문에, 다양한 형태의 데이터가 실무에서 발생하기에, 기업에서 활용하기 많은 용이한 많은 장점을 가지고 있음 / 사용하기 쉽고, 데이터를 빠르게 처리하며, 어디서나 접근 가능
- 개인적인 관점에서의 이유 : 오로지 나 자신을 위해서, 나 자신의 행복한 생활을 위해서!! 업무를 빠르고 정확하게 수행하기 위해서!! 빠른 퇴근을 위해서 ㅎㅎ
2. 엑셀을 잘한다는 것은 무엇일까?
- 사용자의 입장에서 / 목적에 부합하도록 / 자료를 구성하는 것
- 팀장님/부장님/사장님 등등 대상(이 보고서를 받을) 입장에서 생각하고, 원하는 것이 무엇인지 파악하고, 무엇을 말한 것인지 잘 구성한다는것이 엑셀을 잘 한다고 할 수 있는 것임!!
- 그럴려면 일을 시작하기 전에 이 일을 어떻게 처리 할지 생각을 하는 과정과 사후 피드백을 메모를 잘해서 다음번에는 더 나은 결과물을 만드는 것이 일을(엑셀을)잘한다는 것이라 할 수 있음
3. 엑셀의 기본 원리
- 값 / 수식/ 서식 : 엑셀의 모든 셀에는 (기본) 서식이 적용되어 있다
- 엑셀의 행(숫자, 가로)과 열(알파벳, 세로)의 변경(이동) : 행은 상하로, 열은 좌우로 변경됨(이동함)
숫자가 위아래로, 알파벳은 양옆으로
4. 엑셀 단축키 = 치트키 사용!!
- ctrl + shift + 1 : 셀 서식에 통화표시(세 자리 마다 쉼표)
- ctrl + shift + 2 : 셀 서식에 시간표시 / +3 날짜표시 / +4 $ 표시 / +5 %표시
- 행, 열 추가 : ctrl + (shift, 키패드위에있는거 미사용시에) ‘+’ 기호
- 행,열 삭제 ctrl + ‘-’틀 고정은 항상 내가 하고 싶은 행 하나 아래에다가 하면 됨 -> 바로 위행부터 적용되기 때문!
5. 엑셀의 기초이자 핵심!!
- 첫번째는, 엑셀의 모든 셀에는 서식이 적용되어 있기 때문에 복붙을 하게 되면 값/수식/기본서식까지 모두 복사되기 때문에 수식 / 값 / 서식을 각각 따로 붙여 넣어야 한다!! (이거 몰라서 맨날 테두리 그리고, 테두리 단축키까지 외워버린 ㅠㅠ)
- 두번째는, 함수를 사용하는 상황에 따라서 절대참조 or 상대참조인지를 잘 봐야한다!! 함수를 쓸때는 특히나 어느 부분의 열 or 행이 고정이 되어야하는지를 잘 봐야한다!!
2) 탐색적 데이터 분석(EDA)
: Back to the Basic, 데이터 어떤 본연의 의미를 찾는데 어려움이 있어서, 주어진 자료를 가지고도 충분한 정보를 찾을 수 있도록 탐색적 자료 분석 방법
1. EDA의 중요성
- 내 입맛대로 수집되는 데이터는 1도 없다, 수집된 데이터의 특성 및 분포를 파악해야함, 결측치(비어있는 값), 이상치(아웃라이어) 유무 파악, EDA의 결과를 바탕으로 필요한 데이터 전처리를 수행할 수 있음, 가장 적합한 분석 방법을 결정할 수 있다
2. 데이터 분석 도구 활용하기
- 엑셀에서 다양한 통계적 데이터 분석을 수행할 수 있는 추가 기능 -> 요약 출력, 분산분석 등등
- 데이터 분석 도구를 활용하여 기초 통계량 계산, 엑셀에 있는 데이터 분석 도구 팩을 활용하여 분석이 가능함
- 엑셀에서 가장 중요하고, 꽃이라 말하는 '피벗 테이블' 활용하는 것이 중요함
- 내가 만들어야 하는 피벗 테이블을 먼저는 머리속으로, 그다음에는 노트에 한번 그려보면 피벗 테이블을 쉽게 작성할 수 있다고함. 어떻게 만들 것인지 한번 그려본다면, 내가 보고자하는 값을 행에 넣을지 열에 넣을지 가시적으로 보이기 때문!!
3. 피벗 테이블/산점도/박스플롯
1) 피벗테이블 : 커다란 표의 데이터를 요약하는 통계표
2) 산점도 : 데이터가 흩어져 있는 정도를 표현하는 그래프, 범위 미지정 상태에서도 그래프 가능
3) 박스플롯 : 이상치 유무 파악에서 사용함, MIN, MAX, 1사분위수, 3사분위수, 중앙값이 산출
4. 데이터 전처리에 대하여
- 데이터 전처리는 데이터를 분석 목적과 방법에 맞게 가공하고 처리하는 과정
- 데이터 전처리 방법 : 데이터의 형태 변환, 변수 선정, 결측치 및 이상치 처리, 데이터 분류, 데이터 분리 및 결합 등으로 구성
- 데이터 전처리 단계는 데이터 분석 과정 중 가장 많은 시간과 비용이 필요한 과정으로 실제로 데이터 분석 과정 중 데이터 전처리가 약 60~80% 정도를 차지함.
- "Garbage in, garbage out" 이라는 말이 있음. 좋지 않은(부적절한) 데이터로 모델을 돌리면 좋지 않은 결과가 나올 수 밖에 없기에, 데이터 전처리 과정이 제일 중요하다는 말이라고도 할 수 있음.
5. 엑셀로 시작하는 데이터 전처리 : '함수'
엑셀 함수는 4전 5기의 컴활 1급을 딴 사람으로써,, 솔직히 자신이 있었지만,, 막상 다시 배우니깐 다 까먹었어요 ㅠㅠ 그래도 실무가서 다시 찾아보고 인수를 하나씩, 자세히 뜯어보다보면 생각이 나니, 이 글을 보시는 분들은 너무 걱정하지 말고, 함수에 관해서 너무 스트레스 받지 않았으면 좋겠네요 ㅎㅎ(일단 저부터,,) 그래도 중요한 함수는 찾아보기 위해서 중요한 것들 위주로만 남겨볼께요~!!
1) SUM : 합계를 구하는 함수
2) AVERAGE : 평균을 구하는 함수
3) IF 함수 : 조건을 만족하는 값을 구하는 함수
4) COUNTA : 비어있지 않은 셀의 개수 파악
5) COUNTIF(범위 , " 조건 ") : 특정 범위에서 하나의 조건을 만족하는 셀의 개수 파악
6) COUNTIFS(범위1, " 조건1 ", 범위2, " 조건2 ") : 2개 이상의 조건을 동시에 만족하는 셀의 개수 파악
→ COUNTIFS 는 조건이 1개일 경우에도 사용가능, COUNTIFS를 보통 더 많이 쓴다고함!!
7) VLOOKUP(찾을 기준 데이터, 불러올 데이터의 범위(공통 기준열부터), 불러올 데이터의 열 번호(공통 기준열을 1열로 했을 때), 0)
8) MATCH( 찾고싶은 컬럼명:절대참조, 찾고싶은 컬럼이 포함된 하나의 열 또는 하나의 행을 범위로 지정:절대참조, 0 or 1)
9) INDEX(범위, 지정한 범위 내의 행번호,지정한 범위 내의 열번호)
→ INDEX 함수와 MATCH 함수를 이용하여 VLOOKUP 함수의 한계를 극복가능
10) SUMIF(더할 조건의 범위에 해당하는 열 전체 지정, 조건 더할 값의 범위에 해당하는 열 전체 지정)
: 더할 조건/값 범위를 지정할 때, 행 범위도 맞춰야하며, 절대참조 걸어주는 센스!! COUNTIFS와 마찬가지로, SUMIFS 함수도 조건이 1개여도, 2개 이상이어도 모두 적용 가능!!
11) 날짜 데이터
(1) ' - ' 하이픈을 사용하여 날짜를 입력하면, 서식이 자동으로 [일반]에서 [날짜]로 변경
(2) 날짜 데이터의 계산 : 종료일 - 시작일 + 1 = 기간 (단, 종료일은 기간에서 제외되므로 +1을 해주는 것)
(3) DAYS(종료일, 시작일)
(4) DATEDIF(시작일, 종료일, "D") - D : 일 수 / M : 월 수 / Y : 연 수/ YM : 올해의 월 수 / MD : 이번 달의 월 수
(5) YEAR() : 해당 연도만 표시
(6) MONTH() : 해당 월만 표시
자 1주차 내용은 이로써 간단하게 끝!! 놓친 부분들이 많은거 같아서 아쉬운데, 다음주에는 좀 더 필기를 열심히 하고, 핵심을 요약해서 간단하게 올리겠습니다~!! :)
엑셀로 배우는 간단한 기초 통계와, 데이터 분석!! 컴활 1급을 오랫동안 공부해서, 많은 부분들을 알고는 있었지만 이렇게 다시 배우고, '데이터 분석'이라는 관점에서 다시 배우고 공부해보니 재밌고 유익했던 것 같습니다 ㅎㅎ
다음주에는 이제 비전공자들에게 매우 어려운 '데이터 분석을 위한 기초 통계학'을 배우기로 되어있는데요!! 제가 잘 할 수 있을지는 모르겠지만...!! 다음주 한 주도 공부 열심히 해서 학습일지 올려야겠네요~!! 궁금하신 사항은 댓글 남겨주시길 :) 😀😀

'[교육&스터디] > [패스트 캠퍼스] 데이터 분석 부트캠프 9기' 카테고리의 다른 글
[패스트 캠퍼스] 데이터 분석 부트캠프 9기 !! 현직자 특강!!(남동욱 강사) (0) | 2023.07.18 |
---|---|
[데이터 분석 부트캠프] 4주차 진행 및 학습일지 (0) | 2023.07.13 |
[패스트 캠퍼스] 데이터 분석 부트캠프 !! OT 솔직 후기 !! (8) | 2023.07.08 |
[데이터 분석 부트캠프] 3주차 진행 및 학습일지 (0) | 2023.07.06 |
[데이터 분석 부트캠프] 2주차 진행 및 학습일지 (0) | 2023.06.30 |
댓글