- Today
- Total
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | 5 | ||
6 | 7 | 8 | 9 | 10 | 11 | 12 |
13 | 14 | 15 | 16 | 17 | 18 | 19 |
20 | 21 | 22 | 23 | 24 | 25 | 26 |
27 | 28 | 29 | 30 | 31 |
- 회고록
- 개념정리
- 파이썬
- 데이터
- 파이썬문법
- Jupyter Notebook
- github
- error
- 모두의연구소
- 데이터사이언스
- 데이터베이스
- 함수
- bigquery
- python
- sql
- data
- 딕셔너리
- AI
- 2주차
- 회고
- 딥러닝
- 주피터노트북
- 프로젝트
- 데이터사이언티스트
- 1주차
- 머신러닝
- 변수
- 깃허브
- ML
- 빅쿼리
[Data Scientist] Week6 회고록 (+Machine Learning) 본문
✅ 새로 알게 된 개념이나 학습 내용🧠📘💡
https://jpocket.tistory.com/43
[ML] Machine Learning 머신러닝 과정 정리 (코드로 이해하기)
머신러닝 전체 흐름도 도식화사용 툴: tldraw 데이터 준비# 데이터 생성import pandas as pdimport numpy as npdata = pd.DataFrame({ '메뉴': ['[인기]아이펠치킨','닭강정','간장치킨','마늘치킨','파닭','승일양념치
jpocket.tistory.com
📝 약간의 일상 공유☕🍀📷
벌써 5월이다.
날씨가 풀리면서 약속도 많아진다.
오랜만에 에버랜드를 다녀왔는데
눈치게임 성공해서 놀이기구 13개 타고 왔다.
📅 이번 위크는 어땠는지📅🌀📈
배우고 싶었던 분야라서 어렵지만 재밌기도 한 듯?
복습과 예습, gpt 뚜까패면서(?) 이해 안 되는 거 모두 짚고 넘어가려고 하는 중이다.
이번 머신러닝 주차는 조금 색다른 방식으로 진행되었다.
가장 성능이 좋은 모델을 만들어내는 캐글 대회가 열려 학구열을 불태웠다.
캐글 노트북 상에서는 성능이 잘 나왔는데, 막상 제출하니 점수가 0.03... 충격이었다.
다음 날 풀이 시간에,
“Class 컬럼에 predict_proba의 값을 넣어야 한다”
는 말을 듣고 제출 코드만 수정해 봤더니 0.96805가 나왔다...! 😭
알고 보니 나는 제출 코드에서 Class 컬럼에 predict 값을 넣었던 것이 문제였다.
사진에서, Class 컬럼에는 각 샘플이 클래스 1일 확률을 가지고 있다.
predict로 제출하면 단순히 1인지 0인지만 알려주기 때문에 점수가 낮게 나왔던 것이다.
캐글에서 제출 형식이 얼마나 중요한지 제대로 배웠다.
무튼 너무 재밌게 머신러닝을 배운 것 같다.
앞으로도 다양한 방식의 학습이 계속되기를 기대한다.
🌟 잘한 점👏🌈🏅
이해 안 되는 것들 모두 이해하고 넘어간 점
🔧 개선해야 할 점🛠️🧹🪞
블로그 정리를 꾸준히 하고 있는데
2개로 나눠서 쓸 분량을 하나의 게시글에 다 담으려고 노력 중이다.
그래야 모르는 거 찾기가 쉬운 듯하다.
🎯 앞으로의 목표🎯🚀📍
주어진 데이터 말고 외의 것들로도 머신러닝을 적용해보고 싶다.
'Data Scientist' 카테고리의 다른 글
[Data Scientist] Week8 회고록 (+데이터톤 DATATHON, 딥러닝) (3) | 2025.07.06 |
---|---|
[Data Scientist] Week7 회고록 (+금융 시계열 데이터) (0) | 2025.06.06 |
[Data Scientist] Week5 회고록 (0) | 2025.05.07 |
[Data Scientist] Week4 회고록 (+Data Processing 과정 정리) (1) | 2025.04.22 |
[Data Scientist] Week3 회고록(KPT) (0) | 2025.04.13 |