KT AIVLE School/Python프로그래밍 & 라이브러리

데이터 분석/모델링을 위한 데이터 구조

Rabet 2024. 9. 5. 16:48

 

CRISP-DM

비즈니스 문제 해결 방법론

이는 데이터 → 분석 및 모델링을 하기 위한다.

 

회사는 AI개발 역량을 가지고 비즈니스 문제를 해결하기를 기대하기 때문에 매우 중요하다.

 

 

 

1. 분석할 수 있는 데이터

데이터는 타입이 아닌 의미를 통해 두가지로 나뉜다.

.

① 범주형

질적(정성적) 데이터

- 명목형 데이터 (성별, 시도, 흡연여부)

- 순서형 데이터 (연령대, 매출등급)

② 수치형

양적(정량적) 데이터

- 이상형 데이터 (판매량, 매출액, 나이)

- 연속형 데이터 (온도)

 

2. 기본이 2차원

Table, Array, Data Frame

Label input1 input2 input3
       
       

 

Target, Y, Label, Output (종속변수)

Features, X, input (독립변수)

 

① 열, 변수, 요인, 정보

② 행, 분석단위, 샘플, 관측치, Data point