빅데이터 모델링 – 분석모델 설계 – 분석모델 선정 및 정의

분석 모델 선택 필요

  • 결정
    • 여러 대안 중에서 행동을 선택하는 작업을 수행하는 지각적 정신 활동입니다.
    • 마지막으로 선택이 이루어지고 결과가 그려집니다.
  • 불확실성 감소
    • 불확실성은 의사 결정에서 가장 큰 문제입니다.
    • 분석을 통한 불확실성 통제는 시장 반응에 큰 도움
  • 요약
    • 현재 상황을 쉽고 빠르게 캡처
    • 다음 답변 준비
  • 인과 관계 식별
    • 데이터간 상관관계 분석을 통한 원인과 결과 규명
    • 인과관계 파악을 통한 정밀진단 가능
  • 예측
    • 원인과 결과 패턴을 식별하면 다음에 발생할 결과도 예측할 수 있습니다.
    • 반드시 같은 패턴으로 이어지는 결과는 아니지만 앞으로 일어날 결과에 대비할 수는 있다.
  • 빅데이터 분석의 기본 목적
    • 과거의 데이터로 근본 원인을 분석하고 그 결과 미래를 예측
      • 데이터에는 지연 특성이 있지만 시퀀싱 특성도 있습니다.

해석 모델 선정 절차

  1. 대상 데이터 선택 및 분석 문제 요구 사항 정의 또는 비즈니스 이해에 따른 대상/조건 정의
  2. 데이터 수집, 정리 및 매핑
  3. 데이터 전처리(데이터 정리, 종속/독립 변수 선택, 데이터 변환, 데이터 통합, 데이터 축소 등)
  4. 최적해석모델 선정

해석 모델의 정의 및 종류

  • 예측 분석 모델
    • 과거 상황에 따른 데이터와 가설을 바탕으로 미래 현상을 분류하고 예측하는 모델
    • “무슨 일이 일어날까요?”에 대한 모델
      • 적조, 날씨, 주가, 범죄/위험, 쇼핑물품 등 예측 및 추천
  • 상태 진단 모델
    • 과거 데이터를 활용하여 현재 상황을 객관적으로 진단하는 모델
    • 미래를 예측하는 대신 현재를 이해하는 데 사용하십시오.
    • “왜 과거에 무슨 일이 일어났습니까? 그리고 지금은 무엇입니까?”에 대한 모델입니다.
  • 최적화 분석 모델
    • 분석 모델 최적화에 중점을 둔 모델
      • 제한된 자원과 환경 내에서 최대 효용과 이익과 같은 결과를 달성하기 위해.

분석 모델 정의를 위한 전제 조건

  • 해석 모델을 정의하기 전에 실제로 해석을 수행할 수 있는 가능성 확인
  • 상황에 맞는 평가기준표 및 표를 작성하고 각 항목에 부여된 종합점수로 분석모형의 가능성을 판단
  • 사전 결정 기준은 긴급하고 실행 가능성이 있는 경우에만 사용할 수 있습니다.

해석모델을 정의하고 구분하기 위한 평가기준표 예시

기본 판단의 근거
필요 개인 또는 기관 관점에서 분석 작업이 필요한지 여부 결정
웨이브 효과 정성적 및 정량적 기대 영향의 범위 결정
긴급 자연과 장기 과제를 분리하여 당장 해결해야 할 사회적 문제가 있는지 판단
구현 옵션 과제를 완수하는 데 어려움이 있는지 판단하기 위해 현실을 평가
데이터 수집 가능성 공공기관과의 협력, 데이터 수집, 데이터 구매 등 제한사항 결정
모델 확장성 파일럿 작업으로 끝나지 않고 작업을 전체 데이터 모델로 확장할 수 있는지 확인
  • 분석 모델을 정의하기에 충분한 데이터 확보 여부 판단
  • 관련 기록 분석 사례 또는 솔루션을 검토하여 이를 최대한 활용할 수 있는지 확인하십시오.
  1. 상향식 접근
    • 문제를 정의하기 어려운 경우 대량의 데이터를 분석하여 인사이트 도출
    • 특정 영역을 결정하고 의사 결정 지점으로 나아가는 과정에서 분석 작업을 식별하는 방법
  2. 하향식 접근법
    • 문제 정의가 가능한 경우 문제 탐색과 연계하여 비즈니스 모델, 외부 참조 모델 또는 분석적 유스 케이스 기반 모델을 발굴하는 방법.
      • Business Model : 수익을 내는 방법을 확인하여 문제 해결을 위한 분석과제 발굴
      • 외부 참조 모델: 벤치마킹을 통한 분석 주제에 대한 후보 풀 생성 및 선택
      • 분석 활용 사례 : 솔루션의 영향과 문제에 대한 자세한 설명을 명시하여 구체적인 분석 과제 도출

참조