2024년 제 6회 K-디지털 트레이닝 해커톤은고용노동부와 한국기술대학교 직업능력심사평과원이 주최 및 주관하는 대회로,K-디지털 트레이닝 훈련생 및 수료생을 대상으로디지털 및 신기술 특화 훈련을 통한 신규 앱 및 웹 등을 개발하는 해커톤입니다. 제가 속한 KT AIVLE은 K-Distal-Training에 해당하기에 해커톤 대회에 참여할 수 있었습니다! 팀원 모집 해커톤에 참여하고 싶은 마음에 많은 팀들에 지원했지만선착순으로 받는 모집글들에 지쳐가서 결국 모집글을 적어보려던 중.. 감사하게도 다른분께서 공고글을 올려주신 덕분에 합류하게 되었습니다! 아이디어 산출 첫번째로, 참가 과제가1. 지정과제 : 저출산 및 고령사회에 필요한 첨단, 디지털 서비스 개발2. 자유과제 : 첨단, 디지..
Graphviz 사용 준비
·
KT AIVLE School/머신러닝
Graphviz 설치법 1. graphviz 검색 후 다운로드 클릭 2. 컴퓨터에 맞는 프로그램 다운로드전 64비트 용 설치 프로그램을 다운로드했습니다. - 다운로드가 안된다면?더보기 3. 설치 진행다른 버튼을 안건드리고 계속 다음버튼을 누르셔서 설치해줍니다. 4. Path 설정파일 탐색기 > 내pc > 속성고급 시스템 설정 눌러주시고 환경 변수 클릭! User에 대한 사용자 변수와 시스템 변수2개의 Path를 편집해 줍니다. 찾아보기 > C: > Program Files > Graphviz > bin 파일을 클릭하신 후,환경 변수에 아래 그림과 같이 들어왔음을 확인하시고 확인버튼 누르시면 완료입니다!
성능 평가
·
KT AIVLE School/머신러닝
1. 회귀 모델 성능 평가예측한 값과 실제 값의 차이(오차)로 모델을 평가한다. (1-잡아낸 오차)오차 = 실제값 - 예측값오차의 평균을 구하려면 오차의 합이 필요하다.1-1. 오차의 평균SSESum Squared Error(SSE) : 오차제곱의 합MSEMean Squared Error(MSE) : 오차제곱의 평균RMSERoot MSE(RMSE) : MSE에 루트MAEMean Absolute Error(MAE) : 오차 절대값의 평균MAPEMean Absolute Percentage Error(MAPE) : 실제값 대비 오차 절대값의 평균 SST(Total) : 평균이 해결하지 못한 것 ( 실제값과 평균값 오차의 합, 우리의 자존심 ) SSE(Error) : 예측 모델이 해결하지못한 거 ( 작을 수..
1차 미니 프로젝트 후기
·
KT AIVLE School/프로젝트
1. 주제이번 미니 프로젝트의 주제는 서울시 생활정보 기반 대중교통 수요 분석을 기반으로 버스 노선 추가가 필요한 서울시 내 자치구를 선정하는 것이었습니다. 데이터는 2024년 8월 서울시 구별 4가지의 데이터를 사용하였습니다. - 전처리 결과서울시 구별 버스 승하차 이용 데이터 / 서울시 버스 데이터서울시 구별 생활 인구 데이터 서울시 구별 주민 등록 인구 데이터서울시 구별 업종 등록 데이터 - 4개 데이터 병합 출처 : 서울시 공공데이터 포털 열린데이터광장 메인데이터분류,데이터검색,데이터활용data.seoul.go.kr 2. 진행과정1일차엔 개별로 주어진 데이터를 전처리 및 분석과정이 가졌고2일차에 본격적으로 조별 프로젝트가 시작되었습니다! - 가설 설정우선, 각자 데이터를 분석한 대로 가설을 ..
모델링 코드 구조
·
KT AIVLE School/머신러닝
Scikit-Learn 함수 사용sklearn은 지도, 비지도 학습 알고리즘을 제공하는 파이썬 라이브러리입니다.사이킷런이라고 읽으며 오픈 소스로서 누구나 무료로 사용 가능합니다. 1. 불러오기from sklearn.linear_model import LinearRegressionfrom sklearn.metrics import mean_absolute_error 2. 선언하기model = LinearRegression() 3. 학습하기model.fit(x_train, y_train) 4. 예측하기 y_pred = model.predict(x_test) 5. 평가하기 : mean_absolute_error(y_test, y_pred) 1. 환경준비# 라이브러리 불러오기import numpy as npi..
머신러닝 소개
·
KT AIVLE School/머신러닝
1. 머신러닝에 대한 이해 머신러닝은 연애와 같다.머신러닝 = 애인이 무엇을 좋아하는 지, 실행착오를 통해 배운 것이며머신의 데이터 = 인간의 경험이다. - 학습 방법지도학습 : 학습 데이터에 정답을 주어 패턴을 배우는 방법비지도 학습 : 정답이 없는 데이터만 배우게 하는 방법강화 학습 : 보상(옮음, 싫음)을 통해 배우게 하는 방법 - 과제1. 분류 (Classification)이미 분류된 데이터를 학습하고 새로운 데이터를 분류하는 것 (범주)2. 회귀 (Reqression)이미 결과값이 있는 데이터를 학습하여 연관성을 찾고 새로운 데이터 값 예측하는 것 (연속 숫자)3. 클러스터링 (Clustering)정답이 없는 데이터에서 규칙을 찾아 데이터를 분류 (비지도 학습) 2. 분류와 회귀분류 문제- 모델..
XPath
·
KT AIVLE School/웹크롤링
https://scrapy.org/ Scrapy | A Fast and Powerful Scraping and Web Crawling FrameworkPortable, Python written in Python and runs on Linux, Windows, Mac and BSDscrapy.org Scrapy웹사이트에서 데이터 수집을 위한 오픈소스 파이썬 프레임워크멀티스레딩으로 데이터 수집import scrapy, requestsfrom scrapy.http import TextResponse 1. 프로젝트 생성 !scrapy startproject news!tree news 1. url 수집url = 'https://news.daum.net/'response = requests.get(url)r..
Selenium
·
KT AIVLE School/웹크롤링
Selenium처음에 selenium은 웹 페이지의 테스트를 자동화하기 위해 사용되었다.하지만 웹 크롤링에 많이 사용되게 된다.selenium 패키지로 browser을 chrom driver로 연결한다. SeleniumSelenium automates browsers. That's it! What you do with that power is entirely up to you. Primarily it is for automating web applications for testing purposes, but is certainly not limited to just that. Boring web-based administration tasks can (and shoulwww.selenium.dev 1..
Naver Stock Report
·
KT AIVLE School/웹크롤링
Crawling Naver Stock Report : 정적페이지 종목분석 리포트 : 네이버페이 증권관심종목의 실시간 주가를 가장 빠르게 확인하는 곳finance.naver.com - 네이버 증권 > 리서치 > 종목분석 리포트 > +더보기 1. url 찾기 - Review와 Response에 내가 필요한 데이터가 있는지 확인, Ctrl+F > LG전자가 있는지 확인 - 코드 작성import requestsimport pandas as pdfrom bs4 import BeautifulSouppage = 1url = f'https://finance.naver.com/research/company_list.naver?&page={page}' 2. Request로 HTML 받아오기response = reque..