시계열 데이터 처리

2024. 9. 9. 17:01·KT AIVLE School/데이터 처리 및 분석

 

시계열 데이터의 기준

  1. 시간의 순서와 흐름이 있다.
  2. 시간의 등간격이 동일해야 한다.

 

1. 날짜 데이터 요소

1-1. 날짜 타입으로 변환

pd.to_datetime

data['Date'] = pd.to_datetime(data['Date'], format = "%d/%m/%Y')

 

1-2. 날짜 요소 추출

2가지 방법

 

 

2. .shift()

정보를 이동시켜 이전 값 옆에 붙이기

 

 

3. .rolling()

일정 기간 동안 평균을 이동하면서 구하기 

min_periods : NaN없이 최소 1번째부터 평균구하기

 

4. .diff()

이전 데이터와의 차이 구하기

.diff(2) : 2개 전 데이터와 차이 구하기

# 전날대비 매출액 증감여부 (증가 1, 감소 -1, 동일 0)
data['Grocery_diff'] = np.where(data['Grocery'].diff() > 0, 1, -1 )

 

'KT AIVLE School > 데이터 처리 및 분석' 카테고리의 다른 글

단변량 분석 - 숫자형  (0) 2024.09.10
시각화 라이브러리  (0) 2024.09.10
데이터분석 방법론  (0) 2024.09.10
데이터프레임 결합  (0) 2024.09.09
데이터프레임 변경  (0) 2024.09.09
'KT AIVLE School/데이터 처리 및 분석' 카테고리의 다른 글
  • 시각화 라이브러리
  • 데이터분석 방법론
  • 데이터프레임 결합
  • 데이터프레임 변경
Rabet
Rabet
  • 블로그 메뉴

    • 관리자
    • 글쓰기
  • Rabet
    卯
    Rabet
  • 전체
    오늘
    어제
    • Root (139)
      • QA (1)
        • 오류사항 (1)
      • KT AIVLE School (0)
        • Start (4)
        • Python프로그래밍 & 라이브러리 (6)
        • 데이터 처리 및 분석 (7)
        • 데이터 분석 및 의미 찾기 (7)
        • 웹크롤링 (10)
        • 머신러닝 (10)
        • 딥러닝 (6)
        • 시각지능 딥러닝 (10)
        • 언어지능 딥러닝 (6)
        • JAVA (4)
        • SQL (2)
        • 가상화 클라우드 (5)
        • 프로젝트 (8)
      • 웹공부 (14)
        • SPRING (11)
        • React (1)
      • 코딩 알고리즘 스터디 (23)
      • 코딩테스트 (9)
        • JAVA (8)
        • HTML (1)
      • CS공부 (3)
      • 자격증공부 (3)
        • 정보처리기사 (1)
        • 컴퓨터활용능력 1급 (1)
        • AICE Associate (1)
  • 인기 글

  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.2
Rabet
시계열 데이터 처리
상단으로

티스토리툴바