KT AIVLE School/Python프로그래밍 & 라이브러리
데이터 분석/모델링을 위한 데이터 구조
Rabet
2024. 9. 5. 16:48
CRISP-DM
비즈니스 문제 해결 방법론
이는 데이터 → 분석 및 모델링을 하기 위한다.
회사는 AI개발 역량을 가지고 비즈니스 문제를 해결하기를 기대하기 때문에 매우 중요하다.
1. 분석할 수 있는 데이터
데이터는 타입이 아닌 의미를 통해 두가지로 나뉜다.
.
① 범주형
질적(정성적) 데이터
- 명목형 데이터 (성별, 시도, 흡연여부)
- 순서형 데이터 (연령대, 매출등급)
② 수치형
양적(정량적) 데이터
- 이상형 데이터 (판매량, 매출액, 나이)
- 연속형 데이터 (온도)
2. 기본이 2차원
Table, Array, Data Frame
Label | input1 | input2 | input3 |
Target, Y, Label, Output (종속변수)
Features, X, input (독립변수)
① 열, 변수, 요인, 정보
② 행, 분석단위, 샘플, 관측치, Data point