범주형 변수, 연속형 변수
범주형 변수, 연속형 변수 범주형 변수 정의: 범주형 변수는 일정 범주 또는 카테고리에 속하는 변수입니다. 이산적이며유한한 값을 갖습니다. 예시: 성별(남성, 여성), 혈액형(A, B, AB, O), 교육 수준(고졸, 대졸, 석사, 박사) 등 [추천 그래프] Count Plot: 범주형 변수의 빈도수를 막대 그래프로 표현 Bar Plot: 한 변수에 대한 다른 변수의 값의 평균이나 합을 보여줍니다. Violin Plot: 변수의 분포를 박스 플롯과 함께 보여주어 데이터의 분포와 밀집도를 시각화 연속형 변수 정의: 연속형 변수는 연속적인 값을 가지며, 무한한 범위 안에서어떠한 값이든 가질 수 있습니다. 예시: 키, 몸무게, 온도, 시간 등 [추천 그래프] Histogram: 데이터를 일정한 간격으로 구간을..
2023. 10. 28.
EDA (탐색적 데이터 분석)
EDA (탐색적 데이터 분석) 탐색적 데이터 분석(Exploratory Data Analysis, EDA)은 데이터 과학 및 데이터 분석의 초기 단계 중 하나로, 주어진 데이터셋을 이해하고 데이터의 특성, 구조, 패턴, 이상치 및 관련 정보를 파악하기 위한 프로세스입니다. EDA는 데이터를 탐색하고 분석하는 과정을 설명하며, 다음과 같은 목적과 단계로 수행됩니다. 1. 데이터 이해 데이터를 수집하고 데이터셋의 속성(열)과 관련된 정보를 수집 이 정보는 데이터의 출처, 구조, 특성, 변수 유형, 단위, 데이터 유실 여부, 이상치 등을 포함 2. 데이터 시각화 그래프 및 시각화 도구를 사용하여 데이터의 분포, 패턴, 상관 관계 등을 시각화 이를 통해 데이터의 특징을 빠르게 이해 3. 통계적 요약 기초 통계량..
2023. 10. 27.