💽 DataBase
DataBase
데이터 VS 정보
- 데이터(Data)
- 현실 세계에서 단순히 관찰하거나 측정해 수집한 사실이나 값
- 정보(Information)
- 의사 결정에 유용하게 활용할 수 있도록 데이터를 처리한 결과물
- DIKW 피라미드
- 올라갈 수록 가치가 올라감
정보 시스템 VS 데이터베이스
- 정보 시스템(Information System)
- 조직 운영에 필요한 데이터를 수집하여 저장해두었다가, 필요할 때 유용한 정보를 만들어 주는 수단
- 데이터베이스
- 정보 시스템 안에서 데이터를 저장하고 있다가, 필요할 때 제공하는 역할을 담당
데이터베이스란?
전자적으로 저장되고 사용되는 관련있는 데이터들의 조직화된 집합
특정 조직의 여러 사용자가 공유하여 사용할 목적으로 체계화해 통합, 저장한 운영, 관리하는 데이터의 집합
- 통합 데이터
- 최소의 중복과 통제 가능한 중복만 허용하는 데이터
- 공유 데이터
- 특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있는 공용 데이터
- 저장 데이터
- 컴퓨터가 접근할 수 있는 매체에 저장된 데이터
- 운영 데이터
- 조직의 주요 기능을 수행하기 위해 지속적으로 유지해야하는 데이터
Metadata
Data about Data
- Database를 정의하거나 기술하는 data
- Catalog라고도 부름
- ex) 데이터 유형, 구조, 제약 조건, 보안, 저장, 인덱스, 사용자 그룹 등
- Metadata 또한 DBMS를 통해 저장/관리됨
Data Models
DB의 구조를 기술하는데 사용될 수 있는 개념들이 모인 집합
- DB 구조를 추상화해서 표현할 수 있는 수단을 제공
- DB 구조: 데이터 유형, 데이터 관계, 제약 사항 등
- Data Model은 여러 종류가 있으며, 추상화 수준과 DB 구조화 방식이 조금씩 다르다.
- DB에서 읽고 쓰기 위한 기본적인 동작(Operations)들도 포함한다.
Data Model 분류
- Conceptual(or High-Level) Data models
- 일반 사용자들이 쉽게 이해할 수 있는 개념들로 이루어진 모델
- 추상화 수준이 가장 높음
- 비즈니스 요구 사항을 추상화하여 기술할 때 사용
- Logical(or Representational) Data models
- 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화 할 수 있는 개념들을 제공
- 데이터가 컴퓨터에 저장될 때의 구조와 크게 다르지 않게 DB 구조화를 가능하게 함
- 특정 DBMS나 Storage에 종속되지 않는 수준에서 DB를 구조화할 수 있는 모델
- 종류
- Relational Data Model
- Object Data Model
- Object-Relational Data Model
- Physical(or Low-Level) Data models
- 컴퓨터에 데이터가 어떻게 파일 형태로 저장되는지를 기술할 수 있는 수단을 제공
- Data Format, Data Orderings, Access Path 등
- Access Path: 데이터 검색을 빠르게 하기 위한 구조체
- ex) Index
Database Schema
Data Model을 바탕으로 Database의 구조를 기술한 것
- Schema는 Database를 설계할 때 정해지며, 한번 정해진 후에는 자주 바뀌지 않는다.
Database State
- Database에 있는 실제 데이터는 꽤 자주 바뀔 수 있다.
- 특정 시점에 Database에 있는 데이터를 Database State or Snapshot이라 한다.
- Database에 있는 현재 Instances의 집합이라고도 한다.
Three-Schema Architecture
Database System을 구축하는 Architecture 중 하나
- User Application으로부터 물리적인(Physical) Database를 분리시키는 목적
- 변화 발생 시, 레벨 사이에 매핑만 변경해주면 됨
- 각 레벨을 독립시킴으로써 어느 레벨에서의 변화가 상위 레벨에 영항을 주지 않기 위함
- 대부분의 DBMS가 Three Level을 완벽하게 or 명시적으로 나누지는 않음
- 데이터가 존재하는 곳은 Internal Level
- 세 가지 Level이 존재하며, 각각의 Level마다 Schema가 정의되어 있다.
- External Schemas(or User Views)
- 특정 유저들이 필요로 하는 데이터만 표현
- 그 외 알려줄 필요 없는 데이터는 숨김
- Logical Data Model을 통해 표현
- Conceptual Schemas
- 전체 Database에 대한 구조를 기술
- 물리적인 저장 구조에 관한 내용은 숨김
- Entities, Data Types, Relationships, User Operations, Constraints에 집중
- Logical Data Model을 통해 기술
- Internal Schemas
- 물리적으로 데이터가 어떻게 저장되는지 Physical Data Model을 통해 표현
- Data Storage, Data Structure, Access Path 등 실체가 있는 내용 기술
Database Language
Data Definition Language(DDL)
Conceptual Schema를 정의하기 위해 사용되는 언어
- Internal Schema까지 정의할 수 있는 경우도 있음
Storage Definition Language(SDL)
Internal Schema를 정의하는 용도로 사용되는 언어
- 요즘은 특히 Relational DBMS에서는 SDL이 거의 없고 파라미터 등의 설정으로 대체됨
View Definition Language(VDL)
External Schemas를 정의하기 위해 사용되는 언어
- 대부분의 DBMS에서는 DDL이 VDL 역할까지 수행
Data Manipulation Language(DML)
Database에 있는 Data를 활용하기 위한 언어
- Data 추가, 삭제, 수정, 검색 등의 기능을 제공하는 언어
통합된 언어
오늘날의 DBMS는 DML, VDL, DDL이 따로 존재하지 않고, 통합된 언어로 존재
- 대표적인 예: Relational Database Language: SQL
데이터베이스의 특성
- 실시간 접근
- 사용자의 데이터 요구에 실시간으로 응답
- 계속 변화
- 데이터의 계속적인 삽입, 삭제, 수정을 통해 현재의 정확한 데이터를 유지
- 동시 공유
- 같은 데이터의 동시 사용 지원
- 내용 기반 참조
- 데이터가 저장된 주소나 위치가 아닌, 내용으로 참조
- 연봉 5천 이상의 과장급 이상 사원 찾기