데이터분석 방법론

2024. 9. 10. 11:46·KT AIVLE School/데이터 처리 및 분석

 

CRISP-DM

비즈니스 문제해결 방법론

① 비즈니스 문제 이해 - 가설 수립

무엇이 문제인가?

가설 수립

1. 해결해야 할 문제가 무엇인가? (y, 목표, 관심사)
2. Y를 설명하기 위한 요인을 찾기 (x)  
3. 가설의 구조를 정의 (x → y)

 

② 데이터 이해

1. 초기 가설과 준비된 데이터 셋

데이터 원본 식별 및 취득 (있는 데이터, 없는 데이터 확인)

 

2. 분석을 위한 구조 만들기

 

3. 데이터 탐색

 EDA : 탐색적 데이터 분석 (그래프, 통계량)

 CDA : 확증적 데이터 분석 (가설검정, 실험)

 

4. 가설 확인, 전처리 대상 정리, 데이터와 비즈니스에 대해 이해

 

③ 데이터 준비

모델링을 위한 데이터 구조 만들기

1. 모든 셀은 값이 있어야 한다. (결측치 조치)

2. 모든 값은 숫자여야 한다. (가변수 화)

3. (필요 시) 숫자의 범위가 일치해야 한다. (스케일링)

 

④ 모델링

데이터로부터 패턴을 찾는 과정

- 필요한 2가지

1. 학습 데이터 (train, val, test)

2. 알고리즘

 

⑤ 평가

1. 기술적 관점 평가

2. 비즈니스 관점 평가

 

⑥ 개발

1. 모델 관리

2. AI 서비스 구축

 

 

'KT AIVLE School > 데이터 처리 및 분석' 카테고리의 다른 글

단변량 분석 - 숫자형  (0) 2024.09.10
시각화 라이브러리  (0) 2024.09.10
시계열 데이터 처리  (0) 2024.09.09
데이터프레임 결합  (0) 2024.09.09
데이터프레임 변경  (0) 2024.09.09
'KT AIVLE School/데이터 처리 및 분석' 카테고리의 다른 글
  • 단변량 분석 - 숫자형
  • 시각화 라이브러리
  • 시계열 데이터 처리
  • 데이터프레임 결합
Rabet
Rabet
  • 블로그 메뉴

    • 관리자
    • 글쓰기
  • Rabet
    卯
    Rabet
  • 전체
    오늘
    어제
    • Root (139)
      • QA (1)
        • 오류사항 (1)
      • KT AIVLE School (0)
        • Start (4)
        • Python프로그래밍 & 라이브러리 (6)
        • 데이터 처리 및 분석 (7)
        • 데이터 분석 및 의미 찾기 (7)
        • 웹크롤링 (10)
        • 머신러닝 (10)
        • 딥러닝 (6)
        • 시각지능 딥러닝 (10)
        • 언어지능 딥러닝 (6)
        • JAVA (4)
        • SQL (2)
        • 가상화 클라우드 (5)
        • 프로젝트 (8)
      • 웹공부 (14)
        • SPRING (11)
        • React (1)
      • 코딩 알고리즘 스터디 (23)
      • 코딩테스트 (9)
        • JAVA (8)
        • HTML (1)
      • CS공부 (3)
      • 자격증공부 (3)
        • 정보처리기사 (1)
        • 컴퓨터활용능력 1급 (1)
        • AICE Associate (1)
  • 인기 글

  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.2
Rabet
데이터분석 방법론
상단으로

티스토리툴바