본문 바로가기

BigData6

코호트 분석(Cohort Analysis) 코호트 분석(Cohort Analysis) 코호트란 '특정 기간 동안 공통된 특성이나 경험을 갖는 사용자 집단'을 의미 코호트 분석은 이 집단이 행동 패턴이나 유지율을 '시간의 흐름'을 기준으로 추적, 비교하여 분석하는 것 주로 사용자 행동의 변화나 성과를 이해하고, 비즈니스나 제품의 성과 개선을 위해 활용 1. 코호트 분석 과정 1) 코호트 정의 분석하고자 하는 특성이나 기간에 따라 코호트를 정의 ex) 가입한 월별 사용자, 특정 지역의 고객, 특정 행동을 한 사용자 등을 코호트로 정의 가능 2) 데이터 수집 정의한 코호트에 해당하는 데이터를 수집 이는 보통 사용자 행동 로그, 구매 기록, 이벤트 트래킹 등을 통해 이루어집니다. 3) 측정 지표 설정 분석하고자 하는 목적에 따라 적절한 측정 지표를 설정.. 2024. 3. 4.
데이터 분석 & 마케팅 관련 용어 데이터 분석 & 마케팅 관련 용어 1. 코호트 (Cohort) 특정 기간이나 사건을 기준으로 그룹화된 사용자 집합을 의미 예를 들어, 같은 달에 가입한 사용자들로 구성된 코호트를 비교하여 그들의 특성이나 행동 패턴을 파악 2. 퍼널 (Funnel) 사용자가 제품 또는 서비스를 이용하는 과정을 단계별로 나타내는 모델 예를 들어, 사용자가 웹사이트에 방문하고 회원가입을 마치며 결제까지 이어지는 과정을 퍼널로 표현 3. 리텐션 (Retention) 특정 기간 동안 고객이 제품 또는 서비스를 계속 이용하는 정도를 나타냅니다. 고객 유지율이 높을수록 좋은 성과로 평가 4. LTV (Customer Lifetime Value) 고객 1명이 회사에서 가져올 수 있는 예상 수익을 나타내는 지표 LTV는 고객의 유지 기.. 2024. 2. 24.
데이터 관련 용어 데이터 관련 용어 데이터 레이크 (Data Lake) 정의: 정형/비정형 데이터를 원본 형태로 저장하는 '중앙 저장소'를 의미 데이터 레이크는 다양한 형태의 데이터를 보관하고 필요한 시점에서 처리 및 분석할 수 있도록 합니다. 특징: 스키마나 구조를 미리 정의하지 않고 Raw Data를 보관 용도: 대규모 데이터 분석 및 기계 학습에 활용 데이터 웨어하우스 (Data Warehouse) 정의: 다양한 소스에서 추출한 대규모 데이터를 통합하고 중앙에서 저장하는 시스템 특징: 주로 분석 및 의사결정 지원을 위한 데이터를 저장하며, 일반적으로 대용량이며 정형화된 데이터를 다룹니다. 용도: 기업의 의사결정 프로세스를 지원하고 통합된 데이터를 활용하여 비즈니스 인텔리전스(BI)를 수행 데이터 마트 (Data Ma.. 2024. 2. 3.
OLAP와 OLTP란? OLAP와 OLTP란? OLTP와 OLAP는 데이터 처리 시스템에서 두 가지 주요한 유형의 작업을 나타냅니다. 각각의 역할과 사용 용도는 다르며, 다양한 비즈니스 요구 사항을 지원하기 위해 설계되었습니다. OLAP (Online Analytical Processing) 정의: 다차원 데이터베이스를 기반으로 한 분석 처리를 제공하는 데이터 처리 기술 목적: 의사 결정 지원을 위해 설계 특징: 사용자가 대량의 데이터를 다양한 각도에서 쉽게 분석할 수 있도록 합니다. 성능 요구 사항: 응답 시간이 더 유연하며, 일반적으로 분석적인 쿼리에 대한 처리 속도가 빠를 수록 좋습니다. 데이터 모델: 비정규화된 데이터 모델 사용, 데이터 큐브와 같은 다차원 구조를 갖추어 복잡한 분석을 지원 사용 예시: 시장 분석, 성과.. 2024. 1. 23.
범주형 변수, 연속형 변수 범주형 변수, 연속형 변수 범주형 변수 정의: 범주형 변수는 일정 범주 또는 카테고리에 속하는 변수입니다. 이산적이며유한한 값을 갖습니다. 예시: 성별(남성, 여성), 혈액형(A, B, AB, O), 교육 수준(고졸, 대졸, 석사, 박사) 등 [추천 그래프] Count Plot: 범주형 변수의 빈도수를 막대 그래프로 표현 Bar Plot: 한 변수에 대한 다른 변수의 값의 평균이나 합을 보여줍니다. Violin Plot: 변수의 분포를 박스 플롯과 함께 보여주어 데이터의 분포와 밀집도를 시각화 연속형 변수 정의: 연속형 변수는 연속적인 값을 가지며, 무한한 범위 안에서어떠한 값이든 가질 수 있습니다. 예시: 키, 몸무게, 온도, 시간 등 [추천 그래프] Histogram: 데이터를 일정한 간격으로 구간을.. 2023. 10. 28.
EDA (탐색적 데이터 분석) EDA (탐색적 데이터 분석) 탐색적 데이터 분석(Exploratory Data Analysis, EDA)은 데이터 과학 및 데이터 분석의 초기 단계 중 하나로, 주어진 데이터셋을 이해하고 데이터의 특성, 구조, 패턴, 이상치 및 관련 정보를 파악하기 위한 프로세스입니다. EDA는 데이터를 탐색하고 분석하는 과정을 설명하며, 다음과 같은 목적과 단계로 수행됩니다. 1. 데이터 이해 데이터를 수집하고 데이터셋의 속성(열)과 관련된 정보를 수집 이 정보는 데이터의 출처, 구조, 특성, 변수 유형, 단위, 데이터 유실 여부, 이상치 등을 포함 2. 데이터 시각화 그래프 및 시각화 도구를 사용하여 데이터의 분포, 패턴, 상관 관계 등을 시각화 이를 통해 데이터의 특징을 빠르게 이해 3. 통계적 요약 기초 통계량.. 2023. 10. 27.