시계열 데이터

2024. 9. 13. 16:52·KT AIVLE School/데이터 분석 및 의미 찾기

 

보통 사용하는 시각화 그래프

histplot x, boxplot x, countplot x, kospi x, regplot x, barplot x

 

- 시간의 흐름에 따라 패턴 찾기

1. 라인 차트

x축 = 시간축

plt.figure(figsize = (12,4))
sns.lineplot(x = 'Date', y = 'Close', data = kospi, linewidth = .7)
plt.show()

 

# 축을 양쪽에 두고 그립시다.
plt.figure(figsize = (12,5))
# 왼쪽 축
ax1 = sns.lineplot(x = 'Date', y = 'Close', data = kospi, label = 'Close', color = 'blue', linewidth = .5)
plt.legend(loc='upper left')

 # 오른쪽 축 생성
ax2 = ax1.twinx()
sns.lineplot(x = 'Date', y = 'Volume_Lag', data = kospi, label = 'Volume', color = 'green', linewidth = .5)
plt.legend(loc='upper right')

# 그래프 출력
plt.show()

 

 

 

2. 시계열 데이터 분해

observed : 추세 + 주기 + 오차

Trend : 추세 패턴

Seasonal : 사이클(주기), 계절성 패턴

residual : 오차

 

# 시계열 데이터 분해
decomp = sm.tsa.seasonal_decompose(bike['Count'], model = 'additive', period = 24)

# 그래프 그리기
plt.figure(figsize=(12, 8))
result = decomp_plot(decomp)

 

 

3. 자기상관함수

데이터 차분(difference) 데이터를 만들고
kospi['diff'] = kospi['Close'].diff()

차분을 한다음에 패턴구하는게 좋다.

plot_acf(bike['Count'], lags = 60)
plt.grid()
plt.show()

 

 

- 패턴을 변수로 만들기

1. 날짜 요소 추출

2. 이전 데이터 만들기

3. 이동평균 만들기

4. 차분 데이터

 

어떠한 패턴도 보이지 않는다면 diff

# 데이터 차분(difference) 데이터를 만들고
kospi['diff'] = kospi['Close'].diff()

 

# 그래프를 그리면, 이전과 다른 새로운 관점의 그래프를 얻을 수 있습니다.

plt.figure(figsize = (12,5))
plt.subplot(1,2,1)
sns.histplot(x = 'Close', data = kospi, bins = 50)

plt.subplot(1,2,2)
sns.histplot(x = 'diff', data = kospi, bins = 50)
plt.show()

'KT AIVLE School > 데이터 분석 및 의미 찾기' 카테고리의 다른 글

이변량 분석 : 숫자 → 범주  (0) 2024.09.13
이변량 분석 : 범주 → 범주  (0) 2024.09.13
이변량 분석 : 범주 → 숫자  (2) 2024.09.12
평균 추정과 신뢰구간  (0) 2024.09.12
이변량 분석 : 숫자 → 숫자  (0) 2024.09.11
'KT AIVLE School/데이터 분석 및 의미 찾기' 카테고리의 다른 글
  • 이변량 분석 : 숫자 → 범주
  • 이변량 분석 : 범주 → 범주
  • 이변량 분석 : 범주 → 숫자
  • 평균 추정과 신뢰구간
Rabet
Rabet
  • 블로그 메뉴

    • 관리자
    • 글쓰기
  • Rabet
    卯
    Rabet
  • 전체
    오늘
    어제
    • Root (141)
      • KT AIVLE School (85)
        • Start (4)
        • Python프로그래밍 & 라이브러리 (6)
        • 데이터 처리 및 분석 (7)
        • 데이터 분석 및 의미 찾기 (7)
        • 웹크롤링 (10)
        • 머신러닝 (10)
        • 딥러닝 (6)
        • 시각지능 딥러닝 (10)
        • 언어지능 딥러닝 (6)
        • JAVA (4)
        • SQL (2)
        • 가상화 클라우드 (5)
        • 프로젝트 (8)
      • QA (3)
        • 오류사항 (1)
      • 웹공부 (14)
        • SPRING (11)
        • React (1)
      • 코딩 알고리즘 스터디 (23)
      • 코딩테스트 (9)
        • JAVA (8)
        • HTML (1)
      • CS공부 (3)
      • 자격증공부 (4)
        • 정보처리기사 (1)
        • 컴퓨터활용능력 1급 (1)
        • AICE Associate (1)
        • ISTQB (1)
  • 인기 글

  • 최근 댓글

  • 최근 글

  • hELLO· Designed By정상우.v4.10.2
Rabet
시계열 데이터
상단으로

티스토리툴바