본문 바로가기

전체 글66

OLAP와 OLTP란? OLAP와 OLTP란? OLTP와 OLAP는 데이터 처리 시스템에서 두 가지 주요한 유형의 작업을 나타냅니다. 각각의 역할과 사용 용도는 다르며, 다양한 비즈니스 요구 사항을 지원하기 위해 설계되었습니다. OLAP (Online Analytical Processing) 정의: 다차원 데이터베이스를 기반으로 한 분석 처리를 제공하는 데이터 처리 기술 목적: 의사 결정 지원을 위해 설계 특징: 사용자가 대량의 데이터를 다양한 각도에서 쉽게 분석할 수 있도록 합니다. 성능 요구 사항: 응답 시간이 더 유연하며, 일반적으로 분석적인 쿼리에 대한 처리 속도가 빠를 수록 좋습니다. 데이터 모델: 비정규화된 데이터 모델 사용, 데이터 큐브와 같은 다차원 구조를 갖추어 복잡한 분석을 지원 사용 예시: 시장 분석, 성과.. 2024. 1. 23.
SQL 일반 함수 SQL 일반 함수 1. IFNULL 함수 IFNULL(value1, a) value1이 NULL이면 지정 값 a를 반환하고, 그렇지 않으면 value1을 반환 SELECT IFNULL(NULL, '재고 소진') #결과: '재고 소진' SELECT IFNULL(15, '재고 소진') # 결과: 15 2. COALESCE 함수 COALESCE(value1, value2, ..., valuen) 주어진 값들 중에서 첫 번째로 NULL이 아닌 값을 반환 모든 값이 NULL일 경우 NULL 반환 SELECT COALESCE(NULL, 'Value1', 'Value2') # 결과: Value1 SELECT COALESCE(NULL, NULL, 'Value3') # 결과: Value3 3. NULLIF 함수 NULL.. 2024. 1. 22.
SQL 날짜형 함수 SQL 날짜형 함수 1. CURDATE() / CURTIME() CURDATE(): 현재 날짜 반환 (=CURRENT_DATE()) CURTIME(): 현재 시간 반환 (=CURRENT_TIME()) # [CURDATE] SELECT CURDATE() # 결과 2024-01-21 # [CURTIME] SELECT CURTIME() # 결과 20:17:45 2. CURRENT_TIMESTAMP() / NOW() 현재 날짜+시간 반환 # [CURRENT_TIMESTAMP] SELECT CURRENT_TIMESTAMP() # 결과 2024-01-21 20:17:45 # [NOW] SELECT NOW() # 결과 2024-01-21 20:17:45 3. YEAR() / QUARTER() / MONTH() / W.. 2024. 1. 21.
SQL 문자형 함수 SQL 문자형 함수 1. LOWER('문자열') / UPPER('문자열') LOWER: 소문자 반환 UPPER: 대문자 반환 # [LOWER] SELECT LOWER('ABCDE') # 결과 'abcde' # [UPPER] SELECT UPPER('abcde') # 결과 'ABCDE' 2. LEFT('문자열', n) / RIGHT('문자열', n) LEFT: 왼쪽부터 지정한 수(n)만큼 문자 반환 RIGHT: 오른쪽부터 지정한 수(n)만큼 문자 반환 # [LEFT] SELECT LEFT('Hello My Friends', 5) # 결과 'Hello' # [RIGHT] SELECT RIGHT('Hello My Friends', 7) # 결과 'Friends' 3. SUBSTR('문자열', m, n) 문자열.. 2024. 1. 20.
SQL 숫자형 함수 SQL 숫자형 함수 1. ABS(n) n의 절대값 SELECT ABS(-10) # 결과 10 2. ROUND(n, m) m 기준으로 반올림 SELECT ROUND(15.7862, 2) # 결과 15.79 3. TRUNCATE(n, m) m 기준으로 내림 SELECT TRUNCATE(15.7862, 2) # 결과 15.78 4. CEIL(n) / FLOOR(n) CEIL(n): 크거나 같은 최소 정수 FLOOR(n): 작거나 같은 최소 정수 SELECT CEIL(9.25) # 결과 10 SELECT FLOOR(9.75) # 결과 9 5. POWER(n, m) n의 m 거듭 제곱 SELECT POWER(2, 3) # 결과 8 6. SQRT(n) n의 제곱근(루트) SELECT SQRT(25) # 결과 5 7.. 2024. 1. 19.
iloc와 loc (인덱싱) iloc와 loc (인덱싱) iloc와 loc는 DataFrame에서는 특정 행과 열을 선택하는 데 사용, Series에서는 특정 행을 선택하는 데 사용되는 메서드입니다. 그러나 두 메서드는 선택 방법이 다르며 인덱스 기반(iloc) 선택, 레이블 기반(loc) 선택으로 차이가 있습니다. 인덱싱(Indexing): DataFrame 또는 Series에서 특정한 위치의 데이터에 접근하는 것 1. iloc (integer-location based indexing) 정수 기반의 인덱스를 사용하여 DataFrame의 특정 행과 열을, Series에서는 특정 행을 선택 # df (데이터프레임) +-------+---------+-----+---------------+ | Index | Name | Age | C.. 2024. 1. 18.
분류 모델 / 회귀 모델 분류 모델(Regression Model) / 회귀 모델(Classification Model) 분류 모델과 회귀 모델은 각각 다른 유형의 문제를 해결하는 데 사용됩니다. 여기에 간단한 예시를 통해 설명하겠습니다. 1. 분류 모델 (Classification Model) 사용 예시 이메일 스팸 여부 분류 환자가 어떤 질병에 걸렸는지 판단 (예: 암 여부) 손글씨 숫자 인식 (0부터 9까지 숫자 분류) 설명 분류 모델은 입력 데이터를 여러 클래스 또는 범주 중 하나로 분류하는 데 사용됩니다. 출력은 이산적인 클래스 레이블이며, 주로 범주형 데이터를 다루는 데 적합합니다. 예측하려는 목표가 미리 정의된 클래스 또는 범주 중 하나에 속하는 경우에 사용됩니다. 대표 모델 로지스틱 회귀 (Logistic Regr.. 2024. 1. 17.
scipy 라이브러리 scipy 라이브러리 scipy는 여러 서브 패키지로 구성되어 있으며, 각 패키지에는 다양한 모듈과 함수가 포함되어 있습니다. 이 중에서 몇 가지 주요한 모듈과 함수들을 나열해보겠습니다. 각 모듈 및 함수의 사용 목적은 다양하며, 과학 및 공학 계산을 위한 다양한 도구를 제공합니다. 주로 사용되는 모듈은 아래와 같습니다. scipy.cluster: 계층적 및 비계층적 클러스터링 알고리즘을 제공 scipy.constants: 물리 상수 및 변환에 관련된 상수들 정의 scipy.fftpack: 빠른 푸리에 변환 및 관련 함수를 제공 scipy.integrate: 적분 및 미분 방정식 해결에 사용되는 함수 제공 scipy.interpolate: 보간 및 스플라인 함수를 제공 scipy.linalg: 선형 대수.. 2024. 1. 16.
os 모듈 os 모듈 Python의 표준 라이브러리 중 하나인 os는 "Operating System"의 약자로,운영 체제와 상호 작용하기 위한 다양한 함수와 메서드를 제공합니다. 이 모듈은 다양한 운영 체제에서 동작하도록 설계되어 있으며, 파일 시스템 조작, 환경 변수 액세스, 프로세스 관리 등과 같은 작업을 수행하는 데 사용됩니다. 아래는 os 모듈에서 자주 사용되는 몇 가지 주요 명령문입니다. os.getcwd(): 현재 작업 디렉토리의 경로를 반환 os.chdir(path): 현재 작업 디렉토리를 지정된 경로로 변경 os.listdir(path='.'): 지정된 디렉토리의 파일과 디렉토리 목록을 반환 os.mkdir(path): 지정된 경로에 디렉토리를 생성 os.makedirs(path): 지정된 경로로 .. 2024. 1. 15.