pocket

[Data Scientist] Week6 회고록 (+Machine Learning) 본문

Data Scientist

[Data Scientist] Week6 회고록 (+Machine Learning)

jpocket 2025. 5. 27. 16:54
반응형

✅ 새로 알게 된 개념이나 학습 내용🧠📘💡

https://jpocket.tistory.com/43

 

[ML] Machine Learning 머신러닝 과정 정리 (코드로 이해하기)

머신러닝 전체 흐름도 도식화사용 툴: tldraw 데이터 준비# 데이터 생성import pandas as pdimport numpy as npdata = pd.DataFrame({ '메뉴': ['[인기]아이펠치킨','닭강정','간장치킨','마늘치킨','파닭','승일양념치

jpocket.tistory.com

 

 

📝 약간의 일상 공유☕🍀📷

벌써 5월이다.

날씨가 풀리면서 약속도 많아진다.

오랜만에 에버랜드를 다녀왔는데

눈치게임 성공해서 놀이기구 13개 타고 왔다.

 

 

📅 이번 위크는 어땠는지📅🌀📈

배우고 싶었던 분야라서 어렵지만 재밌기도 한 듯?

복습과 예습, gpt 뚜까패면서(?) 이해 안 되는 거 모두 짚고 넘어가려고 하는 중이다.

 

이번 머신러닝 주차는 조금 색다른 방식으로 진행되었다.
가장 성능이 좋은 모델을 만들어내는 캐글 대회가 열려 학구열을 불태웠다.

캐글 노트북 상에서는 성능이 잘 나왔는데, 막상 제출하니 점수가 0.03... 충격이었다.
다음 날 풀이 시간에,

“Class 컬럼에 predict_proba의 값을 넣어야 한다”

는 말을 듣고 제출 코드만 수정해 봤더니 0.96805가 나왔다...! 😭

 

알고 보니 나는 제출 코드에서 Class 컬럼에 predict 값을 넣었던 것이 문제였다.

사진에서, Class 컬럼에는 각 샘플이 클래스 1일 확률을 가지고 있다.

predict로 제출하면 단순히 1인지 0인지만 알려주기 때문에 점수가 낮게 나왔던 것이다.

캐글에서 제출 형식이 얼마나 중요한지 제대로 배웠다. 

 

무튼 너무 재밌게 머신러닝을 배운 것 같다.

앞으로도 다양한 방식의 학습이 계속되기를 기대한다.

 

 

🌟 잘한 점👏🌈🏅

이해 안 되는 것들 모두 이해하고 넘어간 점

 

 

🔧 개선해야 할 점🛠️🧹🪞

블로그 정리를 꾸준히 하고 있는데

2개로 나눠서 쓸 분량을 하나의 게시글에 다 담으려고 노력 중이다.

그래야 모르는 거 찾기가 쉬운 듯하다.

 

 

🎯 앞으로의 목표🎯🚀📍

주어진 데이터 말고 외의 것들로도 머신러닝을 적용해보고 싶다.

반응형