2과목 | 데이터 분석 기획
자격증 ADsP 2과목 데이터 분석 기획을 정리한 글입니다.
데이터 분석 기획의 이해
분석 대상과 방법
분석 대상과 방법
분석 기획 방안
구분 | 과제 중심적 접근 | 장기적 마스터 플랜 |
---|---|---|
목적 | 빠르게 해결 | 지속적 분석, 원인 해결 |
1차 목표 | 속도 및 테스트 | 정확성 및 배포 |
과제 유형 | 단기적 성과 | 장기적 관점 |
접근 방법 | 문제 해결 | 문제 정의 |
분석 기획시 고려사항
- 가용 데이터: 분석의 기본이 되는 데이터 확보 및 파악
- 적절한 유스케이스 탐색: 기존에 잘 구현되어있는 유사 시나리오 활용
- 장애요소에 대한 사전계획 수립: 조직의 역량으로 내제화
의사결정을 가로막는 요소
- 고정관념, 편향된 생각
- 프레이밍 효과: 동일 상황임에도 개인의 판단과 결정이 달라지는 현상
분석 방법론의 구성요소
- 절차(Procedure), 방법(Methods), 도구와 기법(Tools&Techniques), 템플릿과 산출물(Templates&Outputs)
분석 방법론 모델
- 폭포수 모델: 이전단계가 완료되어야 다음 단계 진행 (Top-Down)
- 나선형 모델: 여러 개발과정을 거쳐 점진적으로 완성, 위험요소 제거 초점
- 프로토타입 모델: 일부분(프로토타입)을 우선 개발하고 보완
- 애자일: 일정한 주기를 가지고 프로토타입을 끊임없이 수정하여 고객의 Needs 반영
KDD 분석 방법론
- 데이터 선택 → 전처리 → 변환 → 마이닝 → 결과평가
- 전처리: 이상값, 잡음 식별 및 데이터 가공
- 변환: 변수 선택 및 차원 축소
CRISP-DM 분석 방법론
- 업무 이해 → 데이터 이해 → 데이터 준비 → 모델링 → 평가 → 전개
- 모델링 단계에서 모델 평가 수행하고 평가 과정 단계에서 모델 적용성 평가 수행
- 평가 → 전개에서 위대한 실패 발생 가능성
빅데이터 분석 방법론
- 분석기획(Planning) → 데이터 준비(Preparing) → 데이터 분석(Analyzing) → 시스템 구현(Developing) → 평가 및 전개(Deploying)
- 분석기획(Planning): 비즈니스 이해 및 범위 설정 → 프로젝트 정의 및 계획 수립 → 프로젝트 위험계획 수립
- 비즈니스 범위 설정: SOW(Statement of Works) - 구조화된 프로젝트 정의서
- 위험계획수립(회피, 전이, 완화, 수용)
- 데이터 준비(Preparing): 필요 데이터 정의 → 데이터 스토어 설계 → 데이터 수집 및 정합성 검정
- 추가적인 데이터 확보 필요시, 데이터 준비 단계로 다시 진행
- 데이터 분석(Analyzing): 분석용 데이터 준비 → 텍스트 분석 → 탐색적 분석 → 모델링 → 모델 평가 및 검증 → 모델 적용 및 운영방안 수립
- 가설 설정을 통해 통계 모델이나 기계학습을 이용한 분류, 예측 등의 모델을 만드는 과정
- 의사코드: 일반적인 언어로 프로그래밍 언어의 알고리즘을 유사한 형식으로 써놓은 것
- 시스템 구현(Developing): 설계 및 구현 → 시스템 테스트 및 운영
- 평가 및 전개(Deploying): 모델 발전계획 수립 → 프로젝트 평가 및 보고
- 분석기획(Planning): 비즈니스 이해 및 범위 설정 → 프로젝트 정의 및 계획 수립 → 프로젝트 위험계획 수립
디자인 싱킹
- 사용자의 공감으로 시작해서 아이디어 발산 & 수렴 과정을 통한 피드백으로 발전하는 과정
- 공감하기 → 문제 정의 → 아이디어 도출 → 프로토타입 → 테스트
하향식 접근 방법
- 문제가 주어지고 해답을 찾기 위해 진행
- 문제 탐색 → 문제 정의 → 해결방안 → 타당성 검토
- 문제 탐색
- 빠짐없이 문제를 도출하고 식별하며 솔루션 초점보다는 가치에 초점
- 기존 시스템 개선하여 사용 가능하면 개선하여 활용
- 비즈니스 모델 캔버스 단순화 측면: 업무, 제품, 고객, 규제와 감사, 지원인프라
- 관점
- 거시적 관점: STEEP(사회, 기술, 경제, 환경, 정치)
- 경쟁자 확대 관점: 대체자, 경쟁자, 신규 진입자
- 시장의 니즈 탐색 관점: 고객, 채널, 영향자
- 분석 유스케이스: 발굴한 분석 기회들을 구체적 과제로 만들기 전에 상세한 설명과 효과를 명시
- 타당성 검토
- 경제적 타당성: 비용대비 편익 분석관점 접근
- 데이터 타당성: 데이터 존재 여부, 분석역량이 필요
- 기술적 타당성: 역량 확보 방안 사전에 수립
- 문제 탐색
상향식 접근 방법
- 문제 정의 자체가 어려울 때 사물을 그대로 인식하는 what 관점
- 주로 비지도 학습
지도 학습 & 비지도 학습
- 지도학습
- 정답이 있는 데이터를 학습
- 분류분석, 회귀분석, 의사결정트리, KNN, SVM
- 비지도학습
- 정답이 없는 데이터를 학습
- 군집분석, 차원축소, 연관규칙분석
분석 과제에서 고려해야 할 5가지 요소
- 데이터 크기, 속도, 데이터 복잡도, 분석 복잡도, 정확도/정밀도
- 정확도(Accuracy)와 정밀도(Precision)는 Trade-off 관계
프로젝트 관리 지식 체계 10가지 영역
- 통합, 범위, 시간(일정), 원가(비용), 품질, 인적자원, 의사소통, 리스크(위험), 조달, 이해관계자
분석 마스터 플랜
우선순위 선정
- 전략적 중요도: 전략적 필요성, 시급성
- 실행 용이성: 투자 용이성, 기술 용이성
ISP
- 중장기 마스터 플랜을 수립하는 절차
ROI 관점
ROI 관점
- 시급성 관점: 비즈니스 효과(Return) - Value
- 난이도 관점: 투자비용 요소(Investment) - Volume, Variety, Velocity
- 시급성 중요시: 3 → 4 → 2
- 난이도 중요시: 3 → 1 → 2
분석 거버넌스 체계 수립
- 조직, 프로세스, 시스템, 데이터, 분석관련 교육 및 마인드 육성 체계
데이터 분석 수준 진단
- 분석 준비도
- 분석업무파악: 사실 분석, 예측, 시뮬레이션, 최적화, 분석 업무 정기적 개선
- 분석 인력 및 조직: 분석전문가, 관리자, 조직, 경영진 이해
- 분석기법: 적합한 기법 사용, 분석기법 라이브러리/개선/평가
- 분석데이터: 데이터 관리, 외부데이터 활용, 기준데이터 관리(MDM)
- 분석문화: 의사결정, 회의에서 활용, 공유 및 협업 문화
- IT 인프라: 운영 시스템 통합, 환경
- 분석 성숙도
- CMMI 모델 기준(1 ~ 5 단계)
- 비즈니스/조직, 역량/IT부문 관점으로 구분
- 도입: 환경, 시스템 구축
- 활용: 업무에 적용
- 확산: 전사 차원 관리, 공유
- 최적화: 혁신 성과 향상에 기여
데이터 분석 성숙도 모델
데이터 분석 성숙도 모델
- 준비형: 낮은 준비도, 낮은 성숙도
- 데이터, 인력, 조직, 분석업무, 분석기법 적용 안 되어 사전 준비 필요
- 정착형: 낮은 준비도, 높은 성숙도
- 인력, 조직, 분석업무, 분석기법 등을 제한적으로 사용
- 도입형: 높은 준비도, 낮은 성숙도
- 조직 및 인력 등은 준비도가 높으나 분석업무 및 기법 부족
- 확산형: 높은 준비도, 높은 성숙도
- 6가지 분석 구성요소가 모두 갖추고 있으며 지속력 확산이 가능
분석 지원 인프라 방안 수립
- 확장성을 고려한 플랫폼 구조 적용 (중앙집중적 관리)
데이터 거버넌스
- 데이터 거버넌스
- 전사 차원에서 데이터에 대해 표준화된 관리 체계 수립
- 구성요소: 원칙, 조직, 프로세스
- 중요 관리대상
- 마스터 데이터: 자료처리에 기준이 되는 자료
- 메타데이터: 다른 데이터를 설명해주는 데이터
- 데이터 사전: DB에 저장된 정보를 요약
- 데이터 거버넌스 체계
- 데이터 표준화: 메타데이터 및 사전 구축
- 데이터 관리 체계: 효율성을 위함
- 데이터 저장소 관리: 저장소 구성
- 표준화 활동: 모니터링, 표준 개선 활동
조직 및 인력방안 수립
- DSCoE: 분석조직
- 집중 구조: 독립적인 전담 조직 구성(중복 업무 가능성 존재)
- 기능 구조: 해당 부서에서 직접 분석(DSCoE가 없음)
- 분산 구조: 분산 조직 인력을 현업 부서에 배치
This post is licensed under CC BY 4.0 by the author.