- Today
- Total
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | 6 | |
7 | 8 | 9 | 10 | 11 | 12 | 13 |
14 | 15 | 16 | 17 | 18 | 19 | 20 |
21 | 22 | 23 | 24 | 25 | 26 | 27 |
28 | 29 | 30 |
- 변수
- 깃허브
- data
- 데이터
- 회고
- 주피터노트북
- 프로젝트
- 데이터사이언티스트
- 딕셔너리
- 딥러닝
- AI
- 회고록
- python
- sql
- 빅쿼리
- 데이터베이스
- 2주차
- 함수
- 모두의연구소
- error
- 파이썬문법
- Jupyter Notebook
- 1주차
- 데이터사이언스
- 개념정리
- 머신러닝
- github
- 파이썬
- ML
- bigquery
목록Machine Learning (5)

1. 시계열 데이터란?시계열 데이터란 무엇인가?일정 시간 간격으로 배치된 데이터들의 수열 시계열 분석이란?시간 순서대로 정렬된 데이터에서 의미 있는 요약과 통계정보를 추출하기 위한 노력→ 예측하거나 과거의 행동을 진단하는 과정을 포함현재 시점 t=0t1 t2 t3.. → 과거t+1, t+2, t+3… → 미래 데이터 관련 라이브러리 복기numpy array vs python listnumpy arraypython list하나의 데이터 타입만 배열에 넣을 수 있음여러 타입들을 배열에 넣을 수 있음값들이 저장주소들이 저장속도 빠름속도 느림속도 면에서 더 활용도가 높은 numpy를 사용한다.numpy는 list에 비해 유연성을 부족하지만 연산 속도에 있어 우수 NUMPYnumpy 호출 및 numpy ar..

출처: https://product.kyobobook.co.kr/detail/S000001766511?utm_source=google&utm_medium=cpc&utm_campaign=googleSearch>_network=g>_keyword=>_target_id=dsa-608444978378>_campaign_id=9979905549>_adgroup_id=132556570510&gad_source=1_network=g>_keyword=>_target_id=dsa-608444978378>_campaign_id=9979905549>_adgroup_id=132556570510&gad_source=1" target="_blank" rel="noopener" data-source-url="ht..

지도학습 모델 및 모델 평가1. 지도학습선형회귀릿지 회귀 릿지 회귀 alpha 조정라쏘 회귀 라쏘 회귀 alpha 조정엘라스틱넷 회귀 엘라스틱넷 회귀 alpha, l1_ratio 조정랜덤포레스트 & XGBoost하이퍼 파라미터 튜닝GridSearchCVRandomizedSearchCV 2. 회귀 모델 평가MAEMSERMSERMSLER² Score 사용 툴: tldraw전체 흐름도 지도학습 모델 및 모델 평가 데이터 불러오기# 데이터 생성from sklearn.datasets import load_diabetes # 당뇨병 환자 데이터def make_dataset(): dataset = load_diabetes() df = pd.DataFrame(dataset.data, columns=da..

지도학습 모델 및 모델 평가1. 지도학습의사결정나무의사결정나무 하이퍼 파라미터 랜덤포레스트랜덤포레스트 하이퍼 파라미터XGBoostXGBoost 하이퍼 파라미터조기종료 2. 모델 평가교차검증KFoldStratifiedKFold간편하게 교차검증평가평가지표 사용 툴: tldraw전체 흐름도 지도학습 모델 및 모델 평가 데이터 불러오기import pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import accuracy_score# 데이터 생성from sklearn.datasets import load_breast_cancerdef make_dataset(): iris = load_breas..

머신러닝 전체 흐름도 도식화사용 툴: tldraw 데이터 준비# 데이터 생성import pandas as pdimport numpy as npdata = pd.DataFrame({ '메뉴': ['[인기]아이펠치킨','닭강정','간장치킨','마늘치킨','파닭','승일양념치킨','양념반후라이드반','황금후라이드','[베스트]풀잎치킨'], '가격': [16000,15000,14000,14000,14000,13000,13000,12000,9900], '호수' : [11,12,9,9,11,10,10,10,10], '칼로리' : [1200.0,1500.0,1600.0,1800.0,1300.0,1400.0,1300.0,1000.0,1000.0], '할인율' : [0.5,0.2,0...