- Today
- Total
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 데이터베이스
- 개념정리
- 1주차
- 변수
- python
- sql
- 함수
- 빅쿼리
- 모두의연구소
- bigquery
- 딕셔너리
- 데싸4기
- data
- 논리연산자
- error
- 데이터사이언티스트
- 컴프리헨션
- 데이터
- 2주차
- 비교연산자
- Jupyter Notebook
- 파이썬문법
- 파이썬
- 주피터노트북
- github
- AI
- 함수활용
- 환경세팅
- 깃허브
- jupyter
목록데이터사이언티스트 (15)
출처: https://velog.io/@yuns_u/Data-Processing ✅ 새로 알게 된 개념이나 학습 내용🧠📘💡데이터 전처리 과정에 대해 깊이 있게 학습하였다."데이터 과학의 80%는 데이터 클리닝에 소비되고, 나머지 20%는 데이터 클리닝하는 시간을 불평하는데 쓰인다."-'kaggle' 창립자 Anthony Goldbloom- 인용된 말에서도 알 수 있듯이,전처리는 매우 중요한 부분이라 따로 정리해 보았다. 데이터 전처리(Data Preprocessing)데이터 전처리(Data Preprocessing)는 특정 분석에 적합하게 데이터를 가공하는 작업을 의미한다. 데이터 전처리 개요필요한 이유: 분석에 부적합한 구조, 누락된 항목, NA(결측값) 존재 등으로 인해 전처리 과정이 ..
1. 프로젝트 개요🎯 목표고객 세분화 및 타깃 마케팅을 위한 RFM 분석 수행🛠️ 사용한 도구BigQuery💻 사용한 언어SQL🧾 분석 대상고객의 구매 데이터📊 분석 방법RFM 분석 (Recency, Frequency, Monetary) 2. RFM 분석이란?Recency (최근성): 고객이 마지막으로 구매한 시점으로부터 얼마나 시간이 지났는지Frequency (빈도): 고객이 얼마나 자주 구매했는지Monetary (금액): 고객이 얼마나 많은 금액을 지출했는지세 가지 요소를 바탕으로 고객을 세분화하여, 각 그룹에 맞는 마케팅 전략을 세울 수 있도록 돕는 방법이다. 3. 학습한 내용BigQuery 사용법: 대용량 데이터 처리 및 SQL 쿼리 최적화 기법을 학습하였다.RFM 분석: 고객의 ..

학습 내용SQL 심화 콘텐츠는 총 4개의 노드로 구성되어 있다.✅ 빅데이터 톺아보기빅데이터를 지탱하는 툴과 기술빅쿼리(BigQuery) 실습 환경 설정하기https://jpocket.tistory.com/29 [Big Query] 빅쿼리 시작하기https://cloud.google.com/free?utm_source=google&utm_medium=cpc&utm_campaign=japac-KR-all-ko-dr-BKWS-all-core-athena-EXA-dr-1710102&utm_content=text-ad-none-none-DEV_c-CRE_668690472449-ADGP_Hybrid+%7C+BKWS+-+EXA+%7C+Txt+-GCP-General-core+brand-main-KWID_437jpoc..
🎯 데이터사이언티스트 부트캠프 수강 이유 📅 25년 2월, 졸업과 함께 취업에 대한 고민이 깊어졌다.작년 막학기 다닐 때만 해도 생각이 없었는데막상 졸업하니 취업하고 싶다.(돈 벌고싶)💸 여기저기 채용 공고도 알아봤는데그때 깨달았다.난 아무것도 아닌 먼지같은 존재인 걸.💨 부랴부랴 취업 준비에 전념하기로 했고전공 살려서 취업하는 것을 목표로 관련 채용 공고를 보던 중,요즘 트렌드인지 유독 AI와 관련된 공고가 눈에 띄게 많았다. 🤖10년 뒤 미래를 생각해서라도 반드시 배워야 할 기술이란 확신이 들었다.🧠📈✨ 그렇지만 AI만 배우는 건 당장 취업에 직접적인 도움이 되지 않을 것 같아평소 관심있던 데이터 분야와 AI가 결합된 부트캠프를 찾아보았다.내가 고른 부트캠프의 기준은 다음과 같..

학습 내용데이터베이스데이터와 데이터베이스 개념데이터베이스 특징관계형 데이터베이스테이블테이블행(Row), 열(Column) 개념스키마와 데이터 타입스키마데이터 타입 🛠데이터베이스🛠데이터: 모든 기록들. 과거에 비해 데이터 양이 방대해졌기에 그만큼 복잡성이 증대되었다고 한다.따라서 데이터를 전문적으로 봐야하는 직군들이 증가되었다. 🛠데이터베이스데이터가 모여져 있는 공간이며, 구조적인 방식으로 관리되는 데이터들의 집합이다.관리해야 하는 데이터들을 목적에 맞게 저장하며 권한에 따라 수정 및 검색 등 다룰 수 있는 범위가 다르다. 📌 데이터베이스 특징📌1. 실시간 접근성사용자의 질의에 즉시 처리하고 응답한다. 2. 지속적 변화항상 최신의 데이터를 유지할 수 있습니다. 3. 동시 공유⭐다수의 사용..

첫 번째 이야기 / 영상 생성 ai Gen-4runway 회사에서 gen-4 가 나왔다.동영상 생성 모델이다. 극사실주의에 가깝게 영상을 만든다. 두 번째 이야기 / 영상 생성 ai Veo2 구글 Veo2사진을 넣으면 동영상으로 만들어준다. 오픈 액세스가 있어야 들어가진다. 세 번째 이야기 / 영상 생성 ai Meta movie gen 비디오로부터 텍스트를 얻을 수도 있다.비디오에 텍스트를 추가해서 바꿔나갈 수 있다. sound effect도 만들 수 있다. 네 번째 이야기 / 영상 생성 ai sora 오픈 ai sora작년부터 얘기가 나온 모델이긴 하지만비디오를 생성하는 모델로 많이 나오고 있다. 다섯 번째 이야기 / tracking ai tracking ai모니터링, ai의 아이큐 ..

🔶 key-value 추가하기 : setdefault(), update()🔶setdafult()딕셔너리.setdefault( key, value )key값만 넣기dict_uni.setdefault('c')setdefault()를 활용하여 key값을 넣는다.value는 자동으로 None 값이 넣어진다. key, value값 모두 넣기dict_uni.setdefault('e', 101)setdefault()를 활용하여 key, value 모두 넣는다. 🔶update()딕셔너리.update( iterable )추가, 수정이 가능한 update() 함수다.dict_uni.update(f=102)key, value 를 바로 추가할 수 있다. Q. setdefault() 함수와 update() 함수의..

다차원 리스트🔶 1차원 리스트행만 있는 것. 🔶 2차원 리스트흔히 아는 테이블. 🔶 2차원 리스트의 길이 2차원 리스트의 길이(length)는 행의 길이일까? 열의 길이일까?행의 길이 🔶 3차원 리스트depth라는 개념 = 엑셀에서 sheet 개념[depth][행][열] 형태로 사용 🔶 3차원 리스트의 길이depth의 길이list_th[0][0][:]: depth = 0, 첫 번째 행, 열 전체 리스트 함수len(): 리스트의 요소 개수 구하기min(), max(): 리스트에서 최소값, 최대값 구하기sum(): 리스트의 요소 합계enumerate(): zip() 🔶 리스트 안에 숫자가 아닌 자료형이 있을 때' 라는 오류가 뜬다.int형과 str형은 서로의 크고 작음을 비교할 수 없기 때..

1.예약어(Reserved Words) 예약어는 절대로 변수명으로 쓰일 수 없다 2) 25개 예약어예약어 중 True, False, None 을 제외하고는 모두 소문자로 이루어져 있다.즉, 예약어는 대,소문자를 구별하니 주의해야 합니다. 🔥 한 줄 요약더보기위의 예약어로는 변수명으로 사용하지 못한다. 2.함수1) 파이썬에서 함수란이미 내장되어 있는 함수를 가져다가 사용할 수도 있고, 직접 만들 수도 있다.파이썬에서는 식별자 뒤에 괄호가 붙어 있으면 해당 식별자를 함수라 부른다. 함수를 왜 사용하나요?매번 동일한 코드를 반복해서 쓰는 것보다함수로 한번 정의해 놓고 계속 사용하는 것이 효율적이기 때문 함수에 대한 용어 모음zip- 함수를 정의한다.- 함수를 호출한다.- 매개변수- 인수- 리턴값, 반..

1. 튜플 자료형1) 튜플(tuple)이란?여러 개의 값의 모음이라는 점에서 리스트와 비슷하지만 수정할 수 없다 는 점에서 다르다.소괄호() 안에 요소를 콤마,로 구분튜플명 = (요소1, 요소2, 요소3, ...)소괄호()를 생략해도 무방튜플명 = 요소1, 요소2, 요소3, ...튜플에 소속되는 각각의 값 또한 요소(element) 라고 한다.튜플 안에는 어떠한 자료형도 포함비어 있는 튜플도 생성 2) 튜플에서 가능한 것과 불가능한 것가능한 것튜플 요소를 인덱싱 & 슬라이싱+ 연산자로 튜플을 연결* 연산자로 튜플을 반복 불가능한 것튜플 요소를 변경하거나 삭제(del)하는 것은 불가능 튜플을 언제 사용하나요?튜플의 내부 구조가 단순한 만큼 더 적은 메모리를 사용하고 읽는 속도도 빠르다.편집할 수 없기 때문..