- Today
- Total
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- github
- 데싸4기
- 랜덤포레스트
- Jupyter Notebook
- 2주차
- 컴프리헨션
- 파이썬
- 파이썬문법
- 빅쿼리
- 모두의연구소
- 데이터베이스
- sql
- AI
- 딕셔너리
- 함수활용
- 하이퍼파라미터
- 함수
- 주피터노트북
- XGBoost
- data
- 데이터
- error
- 변수
- 환경세팅
- python
- 1주차
- 개념정리
- bigquery
- 데이터사이언티스트
- 깃허브
목록data (3)
출처: https://velog.io/@yuns_u/Data-Processing ✅ 새로 알게 된 개념이나 학습 내용🧠📘💡데이터 전처리 과정에 대해 깊이 있게 학습하였다."데이터 과학의 80%는 데이터 클리닝에 소비되고, 나머지 20%는 데이터 클리닝하는 시간을 불평하는데 쓰인다."-'kaggle' 창립자 Anthony Goldbloom- 인용된 말에서도 알 수 있듯이,전처리는 매우 중요한 부분이라 따로 정리해 보았다. 데이터 전처리(Data Preprocessing)데이터 전처리(Data Preprocessing)는 특정 분석에 적합하게 데이터를 가공하는 작업을 의미한다. 데이터 전처리 개요필요한 이유: 분석에 부적합한 구조, 누락된 항목, NA(결측값) 존재 등으로 인해 전처리 과정이 ..

첫 번째 이야기 / Mondaychat gpt에서 Monday를 사용할 수 있다.개성이 강한 인공지능이 요즘 추구미?최근 AI 트렌드는 개성이 강한 인공지능을 추구하는 방향으로 변화하고 있음. 두 번째 이야기 / paperbench4월3일 오전2시에 공개되었다. (🔥따끈따끈 최근 소식)paperbench 라는 벤치마크가 오픈소스로 공개되었다.AI 에이전트가 연구 논문 내용을 얼마나 충실하게 구현할 수 있는지 평가하는 시스템. 이미 만들어진 rubric(평가 기준)에 근거하여 얼마나 충실하게 재현하였는지 평가한다.에이전트 시대가 들어온 만큼 다양한 평가들이 연구되고 있는데이의 결과는 💡3.5sonnet가 chat gpt4o 보다 더 성능이 좋게 나왔다.sonnet이 개발자들 사이에서 코딩을 가장 잘..

📑학습 내용✅ 쿼리문 작성과 데이터 필터링쿼리문 작성하기(SELECT, FROM)전체 데이터 필터링하기(WHERE)✅ 비교 연산자 사용하기=!= 또는 >, >=✅ 논리 연산자 사용하기ANDORINNOT✅ 산술 연산자 사용하기+, -, *, / import os # 파일 경로 다룰 때 사용import pandas as pd # pandas를 pd 별칭으로 사용, 데이터 분석을 위한 라이브러리from pandasql import sqldf # sql문법을 사용하여 pandas 데이터프레임을 쿼리하는 기능# pandasql을 전역 환경으로 지정#mysql 람다함수를 정의, sql쿼리를 입력하면 sqldf를 실행mysql = lambda q: sqldf(q, globals())# 데이터 파일 경로 설정da..