- Today
- Total
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 파이썬
- 개념정리
- 컴프리헨션
- 환경세팅
- data
- 파이썬문법
- python
- 주피터노트북
- 논리연산자
- sql
- 함수활용
- error
- 데이터사이언티스트
- 비교연산자
- 딕셔너리
- 데이터
- 1주차
- bigquery
- 함수
- 모두의연구소
- 데싸4기
- 2주차
- 변수
- 깃허브
- jupyter
- 데이터베이스
- AI
- 빅쿼리
- Jupyter Notebook
- github
목록데이터베이스 (11)
1. 프로젝트 개요🎯 목표고객 세분화 및 타깃 마케팅을 위한 RFM 분석 수행🛠️ 사용한 도구BigQuery💻 사용한 언어SQL🧾 분석 대상고객의 구매 데이터📊 분석 방법RFM 분석 (Recency, Frequency, Monetary) 2. RFM 분석이란?Recency (최근성): 고객이 마지막으로 구매한 시점으로부터 얼마나 시간이 지났는지Frequency (빈도): 고객이 얼마나 자주 구매했는지Monetary (금액): 고객이 얼마나 많은 금액을 지출했는지세 가지 요소를 바탕으로 고객을 세분화하여, 각 그룹에 맞는 마케팅 전략을 세울 수 있도록 돕는 방법이다. 3. 학습한 내용BigQuery 사용법: 대용량 데이터 처리 및 SQL 쿼리 최적화 기법을 학습하였다.RFM 분석: 고객의 ..

학습 내용SQL 심화 콘텐츠는 총 4개의 노드로 구성되어 있다.✅ 빅데이터 톺아보기빅데이터를 지탱하는 툴과 기술빅쿼리(BigQuery) 실습 환경 설정하기https://jpocket.tistory.com/29 [Big Query] 빅쿼리 시작하기https://cloud.google.com/free?utm_source=google&utm_medium=cpc&utm_campaign=japac-KR-all-ko-dr-BKWS-all-core-athena-EXA-dr-1710102&utm_content=text-ad-none-none-DEV_c-CRE_668690472449-ADGP_Hybrid+%7C+BKWS+-+EXA+%7C+Txt+-GCP-General-core+brand-main-KWID_437jpoc..

학습 내용✅ 윈도우 함수(1): 함수 구조와 순위 함수윈도우 함수란? 함수 구조 살펴보기순위 함수: RANK, DENSE_RANK, ROW_NUMBER✅ 윈도우 함수(2): 집계 함수집계 함수: SUM, AVG, MAX, MIN행 순서 집계 함수: FIRST_VALUE, LAST_VALUE, LAG, LEAD✅ 그룹 함수그룹함수란? 함수 구조 살펴보기ROLLUP, CUBE, GROUPING SETS 🛠 윈도우 함수 📌 형태SELECT 컬럼 명,WINDOW_FUNCTION(ARGUMENTS) OVER ([ PARTITION BY 컬럼 ] [ ORDER BY 절 ][WINDOWING 절]) FROM 테이블 명; 윈도우 함수는 over 구문이 필수다.윈도우 함수의 종류에 대해 알아보겠다. 🛠..

학습 내용SQL 심화 콘텐츠는 총 4개의 노드로 구성되어 있다.✅ 빅데이터 톺아보기빅데이터를 지탱하는 툴과 기술빅쿼리(BigQuery) 실습 환경 설정하기https://jpocket.tistory.com/29 [Big Query] 빅쿼리 시작하기https://cloud.google.com/free?utm_source=google&utm_medium=cpc&utm_campaign=japac-KR-all-ko-dr-BKWS-all-core-athena-EXA-dr-1710102&utm_content=text-ad-none-none-DEV_c-CRE_668690472449-ADGP_Hybrid+%7C+BKWS+-+EXA+%7C+Txt+-GCP-General-core+brand-main-KWID_437jpoc..

https://cloud.google.com/free?utm_source=google&utm_medium=cpc&utm_campaign=japac-KR-all-ko-dr-BKWS-all-core-athena-EXA-dr-1710102&utm_content=text-ad-none-none-DEV_c-CRE_668690472449-ADGP_Hybrid+%7C+BKWS+-+EXA+%7C+Txt+-GCP-General-core+brand-main-KWID_43700077514871058-kwd-87853815&userloc_1030732-network_g&utm_term=KW_gcp&gad_source=1&gclid=CjwKCAjwzMi_BhACEiwAX4YZUNGdgoAerSUlG_X51sviRxMh7Lt7b..

학습 내용✅ 기본키(PK), 외래키(FK)기본키(PK : Primary Key)외래키(FK : Foreign Key)✅ 다중 테이블 사용하기(JOIN)JOINJOIN의 종류✅ 데이터 이어붙이기(UNION)✅ 서브쿼리 원리와 방식(Subquery)SubqueryWHERE절 서브쿼리단일행 서브쿼리다중행 서브쿼리FROM절 서브쿼리 🛠 UNION데이터를 붙일 때 사용한다.테이블을 아래로, 세로로 붙이며 새로운 행을 생성한다. 🔥주의할 점✅ 2개의 테이블의 컬럼명이 달라도 적용할 수 있다.❌ 컬럼수가 다르면 사용할 수 없다.❌ 컬럼의 데이터 타입이 서로 다르면 사용할 수 없다.👉 즉, 2개의 테이블의 컬럼수와 데이터 타입이 같으면 사용할 수 있다.🚀 종류📌UNION ALL: 중복 포함하여 쿼리..

학습 내용✅ 기본키(PK), 외래키(FK)기본키(PK : Primary Key)외래키(FK : Foreign Key)✅ 다중 테이블 사용하기(JOIN)JOINJOIN의 종류데이터 이어붙이기(UNION)서브쿼리 원리와 방식(Subquery)SubqueryWHERE절 서브쿼리단일행 서브쿼리다중행 서브쿼리FROM절 서브쿼리 🛠 기본키 PK: primary keyPK는 하나의 컬럼이 지정되어 있으며, 해당 컬럼이 데이터는 테이블 내 유일성을 보장한다.유일성을 보장해야 하니까 NULL값은 허용되지 않는다. 🛠 외래키 FK: foreign key다른 테이블과 관계를 맺는 경우, 다른 테이블의 기본키를 참조하는 컬럼기본키를 참조하기 때문에 외래키 값은 참조하는 기본키의 값과 동일하거나 null값이다. 🔥즉..

📑학습 내용집계함수(COUNT, SUM, AVG, MAX, MIN)COUNTSUM, AVG, MAX, MIN집계함수의 특징데이터 그룹화하기(GROUP BY)그룹화한 데이터 조건주기(HAVING) 🛠집계함수(COUNT, SUM, AVG, MAX, MIN)🛠COUNT🛠COUNT(*)모든 행의 개수를 카운트NULL을 포함컬럼의 NULL값 유무를 체크할 수 없다.mysql("""SELECT *FROM bikeWHERE weathersit IS NULL""") 🛠COUNT(컬럼명)NULL 값을 제외한 컬럼명의 행의 개수를 카운트mysql(""" SELECT COUNT(*) AS cnt , COUNT(weathersit) AS weather_cntFROM bike""") 🛠SUM, AVG,..

📑 학습 내용✅ 특정 데이터 조건과 별칭특정 데이터 조건주기(LIKE, Wildcard)별칭 사용하기(Alias)✅ 데이터 정렬과 중복 제거데이터 정렬하기(ORDER BY)중복제거하기(DISTINCT)✅ 조건문 활용하기(IF, CASE WHEN ~ THEN ~)단일 조건문(IF)다중 조건문(CASE WHEN ~ THEN)✅ 데이터 타입 변환하기(CAST) 🛠 LIKE 연산자조회 조건 값이 명확하지 않을 때 특정 내용을 찾을 수 있음조건에 문자나 숫자를 포함할 수 있음주로 Wildcard와 함께 사용 🛠 Wildcard% : 조건을 포함하는 모든 문자를 의미(0개 이상의 문자) 🔥 _ : 한글자를 의미_의 개수에 따라 뒤에 오는 문자열의 개수를 정할 수 있음mysql("""SELECT *FR..

📑학습 내용✅ 쿼리문 작성과 데이터 필터링쿼리문 작성하기(SELECT, FROM)전체 데이터 필터링하기(WHERE)✅ 비교 연산자 사용하기=!= 또는 >, >=✅ 논리 연산자 사용하기ANDORINNOT✅ 산술 연산자 사용하기+, -, *, / import os # 파일 경로 다룰 때 사용import pandas as pd # pandas를 pd 별칭으로 사용, 데이터 분석을 위한 라이브러리from pandasql import sqldf # sql문법을 사용하여 pandas 데이터프레임을 쿼리하는 기능# pandasql을 전역 환경으로 지정#mysql 람다함수를 정의, sql쿼리를 입력하면 sqldf를 실행mysql = lambda q: sqldf(q, globals())# 데이터 파일 경로 설정da..