Post

2과목 | 데이터 분석 기획


자격증 ADsP 2과목 데이터 분석 기획을 정리한 글입니다.

데이터 분석 기획의 이해

분석 대상과 방법

image

분석 대상과 방법

분석 기획 방안

구분과제 중심적 접근장기적 마스터 플랜
목적빠르게 해결지속적 분석, 원인 해결
1차 목표속도 및 테스트정확성 및 배포
과제 유형단기적 성과장기적 관점
접근 방법문제 해결문제 정의

분석 기획시 고려사항

  • 가용 데이터: 분석의 기본이 되는 데이터 확보 및 파악
  • 적절한 유스케이스 탐색: 기존에 잘 구현되어있는 유사 시나리오 활용
  • 장애요소에 대한 사전계획 수립: 조직의 역량으로 내제화

의사결정을 가로막는 요소

  • 고정관념, 편향된 생각
  • 프레이밍 효과: 동일 상황임에도 개인의 판단과 결정이 달라지는 현상

분석 방법론의 구성요소

  • 절차(Procedure), 방법(Methods), 도구와 기법(Tools&Techniques), 템플릿과 산출물(Templates&Outputs)

분석 방법론 모델

  • 폭포수 모델: 이전단계가 완료되어야 다음 단계 진행 (Top-Down)
  • 나선형 모델: 여러 개발과정을 거쳐 점진적으로 완성, 위험요소 제거 초점
  • 프로토타입 모델: 일부분(프로토타입)을 우선 개발하고 보완
  • 애자일: 일정한 주기를 가지고 프로토타입을 끊임없이 수정하여 고객의 Needs 반영

KDD 분석 방법론

  • 데이터 선택 → 전처리 → 변환 → 마이닝 → 결과평가
    • 전처리: 이상값, 잡음 식별 및 데이터 가공
    • 변환: 변수 선택 및 차원 축소

CRISP-DM 분석 방법론

  • 업무 이해 → 데이터 이해 → 데이터 준비 → 모델링 → 평가 → 전개
    • 모델링 단계에서 모델 평가 수행하고 평가 과정 단계에서 모델 적용성 평가 수행
    • 평가 → 전개에서 위대한 실패 발생 가능성

빅데이터 분석 방법론

  • 분석기획(Planning) → 데이터 준비(Preparing) → 데이터 분석(Analyzing) → 시스템 구현(Developing) → 평가 및 전개(Deploying)
    • 분석기획(Planning): 비즈니스 이해 및 범위 설정 → 프로젝트 정의 및 계획 수립 → 프로젝트 위험계획 수립
      • 비즈니스 범위 설정: SOW(Statement of Works) - 구조화된 프로젝트 정의서
      • 위험계획수립(회피, 전이, 완화, 수용)
    • 데이터 준비(Preparing): 필요 데이터 정의 → 데이터 스토어 설계 → 데이터 수집 및 정합성 검정
      • 추가적인 데이터 확보 필요시, 데이터 준비 단계로 다시 진행
    • 데이터 분석(Analyzing): 분석용 데이터 준비 → 텍스트 분석 → 탐색적 분석 → 모델링 → 모델 평가 및 검증 → 모델 적용 및 운영방안 수립
      • 가설 설정을 통해 통계 모델이나 기계학습을 이용한 분류, 예측 등의 모델을 만드는 과정
      • 의사코드: 일반적인 언어로 프로그래밍 언어의 알고리즘을 유사한 형식으로 써놓은 것
    • 시스템 구현(Developing): 설계 및 구현 → 시스템 테스트 및 운영
    • 평가 및 전개(Deploying): 모델 발전계획 수립 → 프로젝트 평가 및 보고

디자인 싱킹

  • 사용자의 공감으로 시작해서 아이디어 발산 & 수렴 과정을 통한 피드백으로 발전하는 과정
  • 공감하기 → 문제 정의 → 아이디어 도출 → 프로토타입 → 테스트

하향식 접근 방법

  • 문제가 주어지고 해답을 찾기 위해 진행
  • 문제 탐색 → 문제 정의 → 해결방안 → 타당성 검토
    • 문제 탐색
      • 빠짐없이 문제를 도출하고 식별하며 솔루션 초점보다는 가치에 초점
      • 기존 시스템 개선하여 사용 가능하면 개선하여 활용
      • 비즈니스 모델 캔버스 단순화 측면: 업무, 제품, 고객, 규제와 감사, 지원인프라
    • 관점
      • 거시적 관점: STEEP(사회, 기술, 경제, 환경, 정치)
      • 경쟁자 확대 관점: 대체자, 경쟁자, 신규 진입자
      • 시장의 니즈 탐색 관점: 고객, 채널, 영향자
      • 분석 유스케이스: 발굴한 분석 기회들을 구체적 과제로 만들기 전에 상세한 설명과 효과를 명시
    • 타당성 검토
      • 경제적 타당성: 비용대비 편익 분석관점 접근
      • 데이터 타당성: 데이터 존재 여부, 분석역량이 필요
      • 기술적 타당성: 역량 확보 방안 사전에 수립

상향식 접근 방법

  • 문제 정의 자체가 어려울 때 사물을 그대로 인식하는 what 관점
  • 주로 비지도 학습

지도 학습 & 비지도 학습

  • 지도학습
    • 정답이 있는 데이터를 학습
    • 분류분석, 회귀분석, 의사결정트리, KNN, SVM
  • 비지도학습
    • 정답이 없는 데이터를 학습
    • 군집분석, 차원축소, 연관규칙분석

분석 과제에서 고려해야 할 5가지 요소

  • 데이터 크기, 속도, 데이터 복잡도, 분석 복잡도, 정확도/정밀도
    • 정확도(Accuracy)와 정밀도(Precision)는 Trade-off 관계

프로젝트 관리 지식 체계 10가지 영역

  • 통합, 범위, 시간(일정), 원가(비용), 품질, 인적자원, 의사소통, 리스크(위험), 조달, 이해관계자

분석 마스터 플랜

우선순위 선정

  • 전략적 중요도: 전략적 필요성, 시급성
  • 실행 용이성: 투자 용이성, 기술 용이성

ISP

  • 중장기 마스터 플랜을 수립하는 절차

ROI 관점

분석우선순위사분면

ROI 관점

  • 시급성 관점: 비즈니스 효과(Return) - Value
  • 난이도 관점: 투자비용 요소(Investment) - Volume, Variety, Velocity
    • 시급성 중요시: 3 → 4 → 2
    • 난이도 중요시: 3 → 1 → 2

분석 거버넌스 체계 수립

  • 조직, 프로세스, 시스템, 데이터, 분석관련 교육 및 마인드 육성 체계

데이터 분석 수준 진단

  • 분석 준비도
    • 분석업무파악: 사실 분석, 예측, 시뮬레이션, 최적화, 분석 업무 정기적 개선
    • 분석 인력 및 조직: 분석전문가, 관리자, 조직, 경영진 이해
    • 분석기법: 적합한 기법 사용, 분석기법 라이브러리/개선/평가
    • 분석데이터: 데이터 관리, 외부데이터 활용, 기준데이터 관리(MDM)
    • 분석문화: 의사결정, 회의에서 활용, 공유 및 협업 문화
    • IT 인프라: 운영 시스템 통합, 환경
  • 분석 성숙도
    • CMMI 모델 기준(1 ~ 5 단계)
    • 비즈니스/조직, 역량/IT부문 관점으로 구분
      • 도입: 환경, 시스템 구축
      • 활용: 업무에 적용
      • 확산: 전사 차원 관리, 공유
      • 최적화: 혁신 성과 향상에 기여

데이터 분석 성숙도 모델

image

데이터 분석 성숙도 모델

  • 준비형: 낮은 준비도, 낮은 성숙도
    • 데이터, 인력, 조직, 분석업무, 분석기법 적용 안 되어 사전 준비 필요
  • 정착형: 낮은 준비도, 높은 성숙도
    • 인력, 조직, 분석업무, 분석기법 등을 제한적으로 사용
  • 도입형: 높은 준비도, 낮은 성숙도
    • 조직 및 인력 등은 준비도가 높으나 분석업무 및 기법 부족
  • 확산형: 높은 준비도, 높은 성숙도
    • 6가지 분석 구성요소가 모두 갖추고 있으며 지속력 확산이 가능

분석 지원 인프라 방안 수립

  • 확장성을 고려한 플랫폼 구조 적용 (중앙집중적 관리)

데이터 거버넌스

  • 데이터 거버넌스
    • 전사 차원에서 데이터에 대해 표준화된 관리 체계 수립
    • 구성요소: 원칙, 조직, 프로세스
  • 중요 관리대상
    • 마스터 데이터: 자료처리에 기준이 되는 자료
    • 메타데이터: 다른 데이터를 설명해주는 데이터
    • 데이터 사전: DB에 저장된 정보를 요약
  • 데이터 거버넌스 체계
    • 데이터 표준화: 메타데이터 및 사전 구축
    • 데이터 관리 체계: 효율성을 위함
    • 데이터 저장소 관리: 저장소 구성
    • 표준화 활동: 모니터링, 표준 개선 활동

조직 및 인력방안 수립

  • DSCoE: 분석조직
  • 집중 구조: 독립적인 전담 조직 구성(중복 업무 가능성 존재)
  • 기능 구조: 해당 부서에서 직접 분석(DSCoE가 없음)
  • 분산 구조: 분산 조직 인력을 현업 부서에 배치
This post is licensed under CC BY 4.0 by the author.