- Today
- Total
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | ||||
4 | 5 | 6 | 7 | 8 | 9 | 10 |
11 | 12 | 13 | 14 | 15 | 16 | 17 |
18 | 19 | 20 | 21 | 22 | 23 | 24 |
25 | 26 | 27 | 28 | 29 | 30 | 31 |
- 논리연산자
- 데이터베이스
- python
- 비교연산자
- data
- error
- 모두의연구소
- 데이터
- 데이터사이언티스트
- 변수
- 함수
- 2주차
- 빅쿼리
- jupyter
- Jupyter Notebook
- 환경세팅
- github
- 딕셔너리
- sql
- 깃허브
- 1주차
- 주피터노트북
- AI
- 파이썬
- 파이썬문법
- bigquery
- 데싸4기
- 함수활용
- 개념정리
- 컴프리헨션
목록분류 전체보기 (42)

머신러닝 전체 흐름도 도식화사용 툴: tldraw 데이터 준비# 데이터 생성import pandas as pdimport numpy as npdata = pd.DataFrame({ '메뉴': ['[인기]아이펠치킨','닭강정','간장치킨','마늘치킨','파닭','승일양념치킨','양념반후라이드반','황금후라이드','[베스트]풀잎치킨'], '가격': [16000,15000,14000,14000,14000,13000,13000,12000,9900], '호수' : [11,12,9,9,11,10,10,10,10], '칼로리' : [1200.0,1500.0,1600.0,1800.0,1300.0,1400.0,1300.0,1000.0,1000.0], '할인율' : [0.5,0.2,0...
✅ 새로 알게 된 개념이나 학습 내용🧠📘💡https://jpocket.tistory.com/41 [통계] AARRR 분석, A/B Test, 신뢰구간, 부트스트래핑, 가설 검정, 회귀분석1️⃣ AARRR 분석 프레임워크서비스의 성과를 측정하는 방법론 🛠 사용자 획득 acquisition : 고객들이 어디에서 유입이 가장 많이 되는가?CAC(Customer Acquistion Cost): 유저 획득 비용신규 유저 1명을 획jpocket.tistory.com 📝 약간의 일상 공유☕🍀📷날씨가 많이 풀려서 요즘따라 기분도 좋아지는 것 같다.내 집중도는 날씨와 반비례 중 📅 이번 위크는 어땠는지📅🌀📈통계 파트는 새롭게 라이브 강의로 진행되었다.다양한 질문들이 올라와서 같이 고민해 봤던 부분을..

1️⃣ AARRR 분석 프레임워크서비스의 성과를 측정하는 방법론 🛠 사용자 획득 acquisition : 고객들이 어디에서 유입이 가장 많이 되는가?CAC(Customer Acquistion Cost): 유저 획득 비용신규 유저 1명을 획득하기 위해 필요한 비용 = (총지출 비용) / (신규 유저 수) 🛠 활성화 Activation체류 시간(Time spent): (마지막 페이지 접속 시간) - (첫 페이지 접속 시간)전환율(CVR): (상품 구매 수) / (서비스 총 방문자 수) 🛠 유지 Retention: 특정 기간동안 활성화된 유저의 수Retention Curve: 리텐션 시간을 기준으로 시각화한 것, 코호트 분석을 시각화 한 그래프Cohort Retention: 동질적인 특성이나 경험을..
문제깃허브 폴더 목록 중 화살표 아이콘이 그려진 폴더가 생겼다. 클릭이 안 되는 문제 발생. 원인문제의 폴더 안에 .git 파일이 있어서다. 해결방법.git 파일 제거 -> 스테이지 파일 제거 -> add, commit, push 진행 상위 폴더와 하위 폴더 모두에 .git 파일이 있는 것이 확인되었다.하위(=sub) 폴더 내부의 .git 파일을 삭제한다.rm -rf .git 이후 스테이지의 파일을 제거해준다.git rm --cached . -rf add, commit, push 진행 git add .git commit -m "Convert [폴더이름] from submodule to regular folder"git push push를 완료하고 결과를 확인해보면 화살표 모양이 사라진 걸 확인할..
출처: https://velog.io/@yuns_u/Data-Processing ✅ 새로 알게 된 개념이나 학습 내용🧠📘💡데이터 전처리 과정에 대해 깊이 있게 학습하였다."데이터 과학의 80%는 데이터 클리닝에 소비되고, 나머지 20%는 데이터 클리닝하는 시간을 불평하는데 쓰인다."-'kaggle' 창립자 Anthony Goldbloom- 인용된 말에서도 알 수 있듯이,전처리는 매우 중요한 부분이라 따로 정리해 보았다. 데이터 전처리(Data Preprocessing)데이터 전처리(Data Preprocessing)는 특정 분석에 적합하게 데이터를 가공하는 작업을 의미한다. 데이터 전처리 개요필요한 이유: 분석에 부적합한 구조, 누락된 항목, NA(결측값) 존재 등으로 인해 전처리 과정이 ..

git rev-parse --show-toplevel git init한 곳이 어딘지 확인하는 명령어 your branch is ahead of origin/master by 2 commits"로컬 브랜치가 원격 저장소(origin/master)보다 커밋 2개 앞서 있다” 즉 아직 푸시(push) 안 된 커밋이 2개 있다는 뜻 강제로 push하여 해결하기git push origin master --force // ⚠️ 다른 사람이 작업한 걸 덮어쓸 수 있으니, 혼자 관리하는 저장소일 때만!! 강제로 push하는 방법을 택했다.어차피 혼자 관리하는 레포라서 덮어쓰기하면 된다.아래의 코드에서 git push 대신에 git push origin master --force 를 사용하면 된다. 깃허..
Jupyter에서 pip를 직접 실행하는 것이 아닌, !pip을 사용해야 하는 이유는 Jupyter가 내부적으로 외부 셸 명령어를 실행하기 위해 !을 사용하는 방식이다.!pip 대신 pip만 사용하면 제대로 설치가 되는 경우도 있지만, 환경에 따라 다를 수 있다. !pip install geopyfrom geopy.distance import distanceModuleNotFoundErrorModuleNotFoundError: No module named 'geopy'설치는 되는데 import부분에서 에러났다. pip list자세히 보니 geopy가 설치가 되어 있지 않아서느낌표를 제거하고 다시 설치했다. pip install geopyfrom geopy.distance import ..
첫 번째 이야기 Meta📚 주요 내용최근 메타(Meta)가 내부 고발자 사라 윈-윌리엄스의 폭로로 논란에 휘말렸다. 사라 윈-윌리엄스: 전직 글로벌 공공정책 책임자, 미국 상원 청문회 출석주장 내용:메타가 중국 정부와 협력하여 검열 도구 제공미국 사용자 데이터를 중국 당국에 노출메타의 반응: 주장 부인, 중국 내 법률과 정책 준수한다고 해명영향:정보 자유와 개인 정보 보호 논란글로벌 기업의 윤리적 책임에 대한 논의 촉발 https://youtu.be/i9T2RKmWg80💬거대한 미국 기업에서도 이런 문제가 발생하니, 사용자들이 불안해할 수밖에 없다.이런 상황은 사람들이 해당 서비스를 이용하는 데 더욱 큰 우려를 불러일으킨다.개인정보 보호와 신뢰성에 대한 논란이 더 대두되는 이유이지 않을까 생각한다. ..
1. 프로젝트 개요🎯 목표고객 세분화 및 타깃 마케팅을 위한 RFM 분석 수행🛠️ 사용한 도구BigQuery💻 사용한 언어SQL🧾 분석 대상고객의 구매 데이터📊 분석 방법RFM 분석 (Recency, Frequency, Monetary) 2. RFM 분석이란?Recency (최근성): 고객이 마지막으로 구매한 시점으로부터 얼마나 시간이 지났는지Frequency (빈도): 고객이 얼마나 자주 구매했는지Monetary (금액): 고객이 얼마나 많은 금액을 지출했는지세 가지 요소를 바탕으로 고객을 세분화하여, 각 그룹에 맞는 마케팅 전략을 세울 수 있도록 돕는 방법이다. 3. 학습한 내용BigQuery 사용법: 대용량 데이터 처리 및 SQL 쿼리 최적화 기법을 학습하였다.RFM 분석: 고객의 ..

✅ 새로 알게 된 개념이나 학습 내용🧠📘💡1. SQLD에서 공부한 범위와 동일했다.group by와 윈도우 함수의 partition by와의 차이에 대해 알게 되었고전체적으로 SQL 심화 개념까지 복습할 수 있었다. 2. BigQuery 툴 및 서비스를 사용하였다.workbench와 oracle을 사용해 본 적이 있어서그다지 어렵게 느껴지진 않았다.SQL을 또 다뤄볼 계기가 되어 좋았다. 3. 프로젝트를 진행하는데 RFM분석 중에서 recency에 관련된 문제가 도저히 이해되지 않았다.정답 결과가 아래와 같이 나온다고 한다. (전체 유저별 중 가장 마지막 구매일) - (유저별 가장 마지막 구매일) = recency전체 유저별 중 가장 마지막 구매일은 2011-12-09이었다.위의 결과에서 모두 0이..