데이터프레임이란?관계형 데이터베이스의 테이블 또는 엑셀 시트 (2차원 구조)시리즈란?하나의 정보에 대한 데이터의 집합데이터 프레임에서 하나의 열을 떼어낸 것! 1. 데이터프레임 생성import pandas as pd 보통 csv를 가져와 데이터 프레임 생성# 데이터 읽어오기path = 'https://raw.githubusercontent.com/DA4BAM/dataset/master/titanic_simple.csv'data = pd.read_csv(path)# 상위 10행만 확인data.head(10) 2. 테이터프레임 정보 확인df.head() : 앞쪽 데이터df.tail() : 뒤쪽 데이터df.info() : 인덱스, 열, 값 개수, 데이터 형식 - 그냥 info는 데이터를 간략하게 표시df.de..
Numpy
·
KT AIVLE School/Python프로그래밍 & 라이브러리
1. Numpyimport numpy as npAxis : 배열의 각 축Rank: 축의 개수(차원)Shape : 축의 길이 (3x4) 2. 배열 만들기2-1. 1차원 배열 만들기 2-2. 2차원 배열 만들기 2-3. 3차원 배열 만들기 2-4. 차원 확인a.ndim a.shape a.dtype 2-5. 차원 바꾸기reshape(행,열) : 요소가 사라지지 않는 형태라면 자유롭게 변환 가능합니다.m차원, -1은 알아서 변경하라는 뜻reshape(m,-1) 2-6. 평균 구하기mean() : np.array에만 가능한 메서드np.mean(arr) 3. 배열 데이터 조회3-1. 1차원 배열 조회열은 생략 가능하다!행은 생략하려면 : 를 붙인다. arr[ 행 , 열 ] - 행, 열arr[ 행 ] - 행 전..
데이터 분석/모델링을 위한 데이터 구조
·
KT AIVLE School/Python프로그래밍 & 라이브러리
CRISP-DM비즈니스 문제 해결 방법론이는 데이터 → 분석 및 모델링을 하기 위한다. 회사는 AI개발 역량을 가지고 비즈니스 문제를 해결하기를 기대하기 때문에 매우 중요하다. 1. 분석할 수 있는 데이터데이터는 타입이 아닌 의미를 통해 두가지로 나뉜다..① 범주형질적(정성적) 데이터- 명목형 데이터 (성별, 시도, 흡연여부)- 순서형 데이터 (연령대, 매출등급)② 수치형양적(정량적) 데이터- 이상형 데이터 (판매량, 매출액, 나이)- 연속형 데이터 (온도) 2. 기본이 2차원Table, Array, Data FrameLabelinput1input2input3 Target, Y, Label, Output (종속변수)Features, X, input (독립변수) ① 열, 변수, 요인, 정..
함수 생성 및 활용
·
KT AIVLE School/Python프로그래밍 & 라이브러리
1. input#함수정의def 함수이름(매개변수1, 매개변수2 = 기본값): 코드 return 결과물#함수 사용함수이름(매개변수1, 매개변수2) 함수의 입력값 수를 정하고 싶지 않을 때 * 추가type은 튜플로 표현된다.def number(*num) : print(num,type(num))2. output print & returnprint : 함수를 보여줘return : 함수결과를 돌려줘 - 여러개의 return 값을 받고 한개만 받고 싶다면?a, _ = 함수이름(1,2) → _를 사용하여 생략한다. 3. 예외 처리3-1. 입력값 예외 처리type(a) == inttype(a) is intint, float, str, list, dict 가능 3-2. 오류 유형별 처리try: 오류를 감지하고자 하..
흐름 제어 (조건문과 반복문)
·
KT AIVLE School/Python프로그래밍 & 라이브러리
1. Bool 연산자True / False 2. 비교 연산자>, =, 3. 논리 연산자and, or, not 4. 코드구조4-1 if 조건문if 조건문 : 코드 if 조건문1 : 코드1else : 코드2 if 조건문1 : 코드1elif 조건문2 : 코드2else : 코드3 4-2. For loopfor 변수 in range(범위): 코드 for 변수 in [list]: 코드 While 조건문 : 코드 조건변경문 for n in range(1,101) : if n % 7 ==0: list.appned#7의 배수를 리스트로 저장list1 = [n for n in range(1,101) if n % 7 == 0]a = {'a':32,'b':[1,..
자료형 (list, dictionary, tuple)
·
KT AIVLE School/Python프로그래밍 & 라이브러리
List : 여러 값을 나열 식으로 저장 관리하는 변수 []Dictionary : 값들을 구조화하여 저장 관리하는 변수 {}Tuple : 좌표, 순서쌍을 담은 자료형 () 1. 생성- 리스트List = [숫자, '문자']list(range(시작값, 끝값, 점프값)) List1 = [List1,2,3]print()함수를 사용 안하고 실행하면 마지막만 보임 - 딕셔너리Dictionary = { key : value, 'd1' : [1,2,3], 'd2' : {'a':1,'b':2} } 2. 조회- 리스트List[인덱스] , 시작은 0, 마지막은 -1List[시작 : 전까지]List[음수왼쪽부터-3 : 오른쪽까지-1]- 딕셔너리Dictionary.key() : 키값 조회Dictionary.values() : ..