시계열 데이터의 기준
- 시간의 순서와 흐름이 있다.
- 시간의 등간격이 동일해야 한다.
1. 날짜 데이터 요소
1-1. 날짜 타입으로 변환
pd.to_datetime
data['Date'] = pd.to_datetime(data['Date'], format = "%d/%m/%Y')
1-2. 날짜 요소 추출
2. .shift()
정보를 이동시켜 이전 값 옆에 붙이기
3. .rolling()
일정 기간 동안 평균을 이동하면서 구하기
min_periods : NaN없이 최소 1번째부터 평균구하기
4. .diff()
이전 데이터와의 차이 구하기
.diff(2) : 2개 전 데이터와 차이 구하기
# 전날대비 매출액 증감여부 (증가 1, 감소 -1, 동일 0)
data['Grocery_diff'] = np.where(data['Grocery'].diff() > 0, 1, -1 )
'KT AIVLE School > 데이터 처리 및 분석' 카테고리의 다른 글
단변량 분석 - 숫자형 (0) | 2024.09.10 |
---|---|
시각화 라이브러리 (0) | 2024.09.10 |
데이터분석 방법론 (0) | 2024.09.10 |
데이터프레임 결합 (0) | 2024.09.09 |
데이터프레임 변경 (0) | 2024.09.09 |