티스토리 뷰
1.1 데이터
- "해석할 수 있는 의미를 가진 기호"
- 사물인터넷(Internet Of Things, IOT)의 발전에 따라 데이터 발생량도 급격히 증가
- "정량적 또는 정성적 변수 값의 집합"
- 숫자처럼 양으로 측정할 수 있는 데이터 : 정량적(qualitative) 데이터
- 텍스트나 이미지처럼 양으로 측정할 수 없는 데이터 : 정성적(quantitative) 데이터
- 정량적 데이터는 구조화 되어 저장되기 때문에 정형(structured) 데이터
- 정성적 데이터는 반대의 이미로 비정형(unstructured) 데이터
- 정량적 데이터 분석 : 정형분석, 정성적 데이터 분석 : 비정형분석
- SQL은 정형 분석에 사용되는 프로그래밍언어
- 빅데이터(Big Data)는 대용량 정형 데이터와 분석 대상이 아니었던 비정형 데이터를 분석하기 위한 기술을 총칭하는 개념.
- 데이터 → 정보(information) → 지식(knowledge) → 지혜(wisdom) → 데이터 : 순환관계
1.2 데이터베이스
- "데이터를 정리해서 모아둔 것"
- 데이터베이스 모델(database model) : 데이터를 효율적으로 관리할 수 있는 방법
- 계층형(hierarchical) 모델, 네트워크형(network) 모델, 관계형(relational) 모델
- 관계형 모델은 릴레이션(relation)에 데이터를 저장
- 릴레이션 : 튜플(tuple)의 집합, 튜플 : 속성(attribute)의 집합
* 속성은 칸 하나를 의미, 튜플은 속성의 가로가 모인 집합을 의미
DEPTNO |
DNAME |
LOC |
10 |
Kim |
NewYork |
20 |
Lee |
Incheon |
30 |
Park |
Canada |
- 관계형 데이터베이스(Relational DataBase, RDB) : 관계형 모델을 채택한 데이터베이스
- 현재는 관계형 데이터베이스를 확장한 객체-관계형 데이터베이스(object-relational database, OBDMS)가 주류
- NoSql 데이터베이스(Not Only SQL Database) : 일관성 모델을 채택하여 사용, 주로 빅 데이터와 실시간 웹 애플리케이션 영역에 활용
1.3 데이터베이스 관리 시스템
- DataBase Management System, DBMS) : 데이터베이스를 관리하기 위한 응용 프로그램
- RDBMS 제품 : IBM DB2, Microsoft SQL Server, MySQL, PostgreSQL, SQLLite
- NoSql DBMS 제품 : MongoDB, Cassandra, Redis
1.4 IT시스템
- 데이터의 발생 유형과 사용 목적에 따라 분류
- 운영시스템(기간계, 계정계), EDW 영역(정보계), BI 영역(대외계)
- 운영시스템에서 발생한 데이터는 EDW영역을 거쳐 BI영역으로 이동
영역 |
목적 |
시스템 |
운영시스템 (Operatinal System) |
기업 운영에 필요한 데이터를 관리 |
OLTP |
EDW (Enterprise Data Warehouse) |
분석을 위한 데이터 저장 |
ODS, DW, DM |
BI (Business Intelligence) |
기업의 효율적인 의사 결정을 지원 |
OLAP |
- 영역별로 데이터의 특성이 다르기 때문에 사용 DBMS도 다름
- 기간계 : Oracle Database, IBM DB2, SQL Server
- 정보계 : Oracle Exadata, SAP Sysbase IQ, IBM Netezza
시스템 |
목적 |
OLTP (OnLine Transaction Processing) |
온라인 트랜잭션을 처리 |
ODS (Operatinal Data Store) |
운영 데이터를 원본의 형태로 보관 |
DW (Data Warehouse) |
운영 데이터를 통일된 형식으로 보관 |
DM (Data Mart) |
DW 데이터를 사용 목적에 따라 요약 |
OLAP (OnLine Analytical Processing) |
DM 데이터를 분석 |
- 각각의 시스템도 운영 목적이 다르기 때문에 사용하는 SQL 유형도 다르다.
- OLTP 시스템은 응다 속도가 빠른 Top-N 쿼리, DW 시스템은 처리량이 많은 집계 쿼리의 비중이 높다
1.5 직종과 직무
- 직종(occupation)과 직무(job)
EA | |||
BA |
AA |
DA |
TA |
staff |
|
|
|
modeler |
| ||
|
tuner | ||
developer |
DBA |
직종 |
역할 |
EA (Enterprise Architect) |
전사 아키텍처를 설계 |
BA (Business Architect) |
업무 아키텍처를 설계 |
AA (Application Architect) |
애플리케이션 아키텍처를 설계 |
TA (Technical Architect) |
하드웨어 아키텍처와 네트워크 아키텍처를 설계 |
DA (Data Architect) |
데이터 아키텍처를 설계 |
* 아키텍처 : 컴퓨터 시스템의 구성
직무 |
역할 |
기술 |
업무 전문가 (staff) |
업무 수행 |
비지니스 지식 |
개발자 (developer) |
프로그램 개발 |
프로그래밍 기술 |
데이터베이스 관리자 (DBA) |
DB 관리 및 운영 |
DB 과리 및 백업과 복구 기술 |
튜너 (tuner) | DB 성능 튜닝 | 아키텍처 지식과 옵티마이저 원리 |
모델러 (modeler) |
데이터 모델 설계 |
비지니스 지식과 모델링 이론 |
* DBA : Database Administrator
* 옵티마이저 : SQL을 가장 빠르고 효율적으로 수행할 최적의 처리경로를 생성해 주는 DBMS내부 핵심엔진
'STUDY - 공부 > 불친절한 SQL 프로그래밍' 카테고리의 다른 글
[1부 기본개념] 2. 데이터 모델링 ing (0) | 2018.11.21 |
---|---|
BNF 표기법, 서드파티(Third Party) (0) | 2018.11.19 |
- Total
- Today
- Yesterday
- 맛집
- 신메뉴
- 인천서구맛집
- 고기맛집
- 꼬막
- 거제도 가볼만한 곳
- 무한리필
- 수요미식회
- 강릉맛집
- 거제도 맛집
- server.xml
- 체험단
- 인천
- 여수
- 인천가좌동맛집
- URIEncoding
- 거제도 여행
- 강원도맛집
- 딜리버리
- 거제도
- 국물요리
- 흑돼지
- 이베리코
- 혼밥
- 돼지고기
- 집밥
- 가성비갑
- 강릉필수코스
- 거제도 명소
- 인천맛집
일 | 월 | 화 | 수 | 목 | 금 | 토 |
---|---|---|---|---|---|---|
1 | 2 | 3 | 4 | |||
5 | 6 | 7 | 8 | 9 | 10 | 11 |
12 | 13 | 14 | 15 | 16 | 17 | 18 |
19 | 20 | 21 | 22 | 23 | 24 | 25 |
26 | 27 | 28 | 29 | 30 | 31 |