- Today
- Total
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- AI
- 딕셔너리
- 빅쿼리
- 함수활용
- 파이썬
- github
- bigquery
- 머신러닝
- data
- 데이터
- 파이썬문법
- XGBoost
- 하이퍼파라미터
- Jupyter Notebook
- ML
- 1주차
- 모두의연구소
- 데싸4기
- 환경세팅
- 데이터베이스
- 데이터사이언티스트
- 개념정리
- 주피터노트북
- 함수
- 2주차
- 깃허브
- sql
- 변수
- python
- error
목록전체 글 (49)
✅ 새로 알게 된 개념이나 학습 내용🧠📘💡https://jpocket.tistory.com/43 [ML] Machine Learning 머신러닝 과정 정리 (코드로 이해하기)머신러닝 전체 흐름도 도식화사용 툴: tldraw 데이터 준비# 데이터 생성import pandas as pdimport numpy as npdata = pd.DataFrame({ '메뉴': ['[인기]아이펠치킨','닭강정','간장치킨','마늘치킨','파닭','승일양념치jpocket.tistory.com 📝 약간의 일상 공유☕🍀📷벌써 5월이다.날씨가 풀리면서 약속도 많아진다.오랜만에 에버랜드를 다녀왔는데눈치게임 성공해서 놀이기구 13개 타고 왔다. 📅 이번 위크는 어땠는지📅🌀📈배우고 싶었던 분야라서 어렵지만 재밌..

1. 시계열 데이터란?시계열 데이터란 무엇인가?일정 시간 간격으로 배치된 데이터들의 수열 시계열 분석이란?시간 순서대로 정렬된 데이터에서 의미 있는 요약과 통계정보를 추출하기 위한 노력→ 예측하거나 과거의 행동을 진단하는 과정을 포함현재 시점 t=0t1 t2 t3.. → 과거t+1, t+2, t+3… → 미래 데이터 관련 라이브러리 복기numpy array vs python listnumpy arraypython list하나의 데이터 타입만 배열에 넣을 수 있음여러 타입들을 배열에 넣을 수 있음값들이 저장주소들이 저장속도 빠름속도 느림속도 면에서 더 활용도가 높은 numpy를 사용한다.numpy는 list에 비해 유연성을 부족하지만 연산 속도에 있어 우수 NUMPYnumpy 호출 및 numpy ar..

출처: https://product.kyobobook.co.kr/detail/S000001766511?utm_source=google&utm_medium=cpc&utm_campaign=googleSearch>_network=g>_keyword=>_target_id=dsa-608444978378>_campaign_id=9979905549>_adgroup_id=132556570510&gad_source=1_network=g>_keyword=>_target_id=dsa-608444978378>_campaign_id=9979905549>_adgroup_id=132556570510&gad_source=1" target="_blank" rel="noopener" data-source-url="ht..

문제import konlpyfrom konlpy.tag import Okttokenizer = Okt() 자연어 처리 실습 도중, 형태소 분석기를 호출할 때 오류가 발생하였다.=> Python에서 konlpy의 Okt 같은 형태소 분석기를 호출할 때내부적으로는 Java로 구현된 분석 엔진을 사용하기 때문에 JVM이 필요하다.그래서 JVM 설치를 해야 한다. 나는 자바가 이미 설치되어 있어서 환경변수만 설정해주었다. 원인자바 환경변수 설정해주어야 한다. 해결방법✅ [1단계] Java 설치 경로 확인하기 윈도우에서 파일 탐색기 열고C:\Program Files\Java 또는 C:\Program Files (x86)\Java 로 이동해서 그 안에 jdk-... 폴더가 있는지 확인해당 경로를 복사해둔다..
문제커밋 메시지를 실수로 두 번 입력하게 되었다.마지막에 쓴 커밋 메시지가 올라간다고 하던데 (-지피티왈-)처음 메시지가 올라갔다. 전에는 push한 Git 커밋 해시 (commit hash)로 되돌려서 다시 push했다.(이렇게 좋은 방법이 있는 줄도 모르고..) 해결방법커밋 잘못 했을 때 다시 커밋 메시지 입력 후 push하기git commit --amend -m " "git push --force commit message를 바꿔서 강제로 push하게 된다.

지도학습 모델 및 모델 평가1. 지도학습선형회귀릿지 회귀 릿지 회귀 alpha 조정라쏘 회귀 라쏘 회귀 alpha 조정엘라스틱넷 회귀 엘라스틱넷 회귀 alpha, l1_ratio 조정랜덤포레스트 & XGBoost하이퍼 파라미터 튜닝GridSearchCVRandomizedSearchCV 2. 회귀 모델 평가MAEMSERMSERMSLER² Score 사용 툴: tldraw전체 흐름도 지도학습 모델 및 모델 평가 데이터 불러오기# 데이터 생성from sklearn.datasets import load_diabetes # 당뇨병 환자 데이터def make_dataset(): dataset = load_diabetes() df = pd.DataFrame(dataset.data, columns=da..

지도학습 모델 및 모델 평가1. 지도학습의사결정나무의사결정나무 하이퍼 파라미터 랜덤포레스트랜덤포레스트 하이퍼 파라미터XGBoostXGBoost 하이퍼 파라미터조기종료 2. 모델 평가교차검증KFoldStratifiedKFold간편하게 교차검증평가평가지표 사용 툴: tldraw전체 흐름도 지도학습 모델 및 모델 평가 데이터 불러오기import pandas as pdfrom sklearn.model_selection import train_test_splitfrom sklearn.metrics import accuracy_score# 데이터 생성from sklearn.datasets import load_breast_cancerdef make_dataset(): iris = load_breas..

머신러닝 전체 흐름도 도식화사용 툴: tldraw 데이터 준비# 데이터 생성import pandas as pdimport numpy as npdata = pd.DataFrame({ '메뉴': ['[인기]아이펠치킨','닭강정','간장치킨','마늘치킨','파닭','승일양념치킨','양념반후라이드반','황금후라이드','[베스트]풀잎치킨'], '가격': [16000,15000,14000,14000,14000,13000,13000,12000,9900], '호수' : [11,12,9,9,11,10,10,10,10], '칼로리' : [1200.0,1500.0,1600.0,1800.0,1300.0,1400.0,1300.0,1000.0,1000.0], '할인율' : [0.5,0.2,0...
✅ 새로 알게 된 개념이나 학습 내용🧠📘💡https://jpocket.tistory.com/41 [통계] AARRR 분석, A/B Test, 신뢰구간, 부트스트래핑, 가설 검정, 회귀분석1️⃣ AARRR 분석 프레임워크서비스의 성과를 측정하는 방법론 🛠 사용자 획득 acquisition : 고객들이 어디에서 유입이 가장 많이 되는가?CAC(Customer Acquistion Cost): 유저 획득 비용신규 유저 1명을 획jpocket.tistory.com 📝 약간의 일상 공유☕🍀📷날씨가 많이 풀려서 요즘따라 기분도 좋아지는 것 같다.내 집중도는 날씨와 반비례 중 📅 이번 위크는 어땠는지📅🌀📈통계 파트는 새롭게 라이브 강의로 진행되었다.다양한 질문들이 올라와서 같이 고민해 봤던 부분을..

1️⃣ AARRR 분석 프레임워크서비스의 성과를 측정하는 방법론 🛠 사용자 획득 acquisition : 고객들이 어디에서 유입이 가장 많이 되는가?CAC(Customer Acquistion Cost): 유저 획득 비용신규 유저 1명을 획득하기 위해 필요한 비용 = (총지출 비용) / (신규 유저 수) 🛠 활성화 Activation체류 시간(Time spent): (마지막 페이지 접속 시간) - (첫 페이지 접속 시간)전환율(CVR): (상품 구매 수) / (서비스 총 방문자 수) 🛠 유지 Retention: 특정 기간동안 활성화된 유저의 수Retention Curve: 리텐션 시간을 기준으로 시각화한 것, 코호트 분석을 시각화 한 그래프Cohort Retention: 동질적인 특성이나 경험을..