💽 DataBase

DataBase

데이터 VS 정보

notion image
notion image
  • 데이터(Data)
    • 현실 세계에서 단순히 관찰하거나 측정해 수집한 사실이나 값
  • 정보(Information)
    • 의사 결정에 유용하게 활용할 수 있도록 데이터를 처리한 결과물
  • DIKW 피라미드
    • 올라갈 수록 가치가 올라감

정보 시스템 VS 데이터베이스

notion image
  • 정보 시스템(Information System)
    • 조직 운영에 필요한 데이터를 수집하여 저장해두었다가, 필요할 때 유용한 정보를 만들어 주는 수단
  • 데이터베이스
    • 정보 시스템 안에서 데이터를 저장하고 있다가, 필요할 때 제공하는 역할을 담당

데이터베이스란?

notion image
전자적으로 저장되고 사용되는 관련있는 데이터들의 조직화된 집합
특정 조직의 여러 사용자가 공유하여 사용할 목적으로 체계화해 통합, 저장한 운영, 관리하는 데이터의 집합
  • 통합 데이터
    • 최소의 중복과 통제 가능한 중복만 허용하는 데이터
  • 공유 데이터
    • 특정 조직의 여러 사용자가 함께 소유하고 이용할 수 있는 공용 데이터
  • 저장 데이터
    • 컴퓨터가 접근할 수 있는 매체에 저장된 데이터
  • 운영 데이터
    • 조직의 주요 기능을 수행하기 위해 지속적으로 유지해야하는 데이터

Metadata

Data about Data
  • Database를 정의하거나 기술하는 data
  • Catalog라고도 부름
  • ex) 데이터 유형, 구조, 제약 조건, 보안, 저장, 인덱스, 사용자 그룹 등
  • Metadata 또한 DBMS를 통해 저장/관리됨

Data Models

DB의 구조를 기술하는데 사용될 수 있는 개념들이 모인 집합
  • DB 구조를 추상화해서 표현할 수 있는 수단을 제공
    • DB 구조: 데이터 유형, 데이터 관계, 제약 사항 등
  • Data Model은 여러 종류가 있으며, 추상화 수준과 DB 구조화 방식이 조금씩 다르다.
  • DB에서 읽고 쓰기 위한 기본적인 동작(Operations)들도 포함한다.

Data Model 분류

  • Conceptual(or High-Level) Data models
    • notion image
    • 일반 사용자들이 쉽게 이해할 수 있는 개념들로 이루어진 모델
    • 추상화 수준이 가장 높음
    • 비즈니스 요구 사항을 추상화하여 기술할 때 사용
  • Logical(or Representational) Data models
    • 이해하기 어렵지 않으면서도 디테일하게 DB를 구조화 할 수 있는 개념들을 제공
    • 데이터가 컴퓨터에 저장될 때의 구조와 크게 다르지 않게 DB 구조화를 가능하게 함
    • 특정 DBMS나 Storage에 종속되지 않는 수준에서 DB를 구조화할 수 있는 모델
    • 종류
      • Relational Data Model
        • notion image
      • Object Data Model
      • Object-Relational Data Model
  • Physical(or Low-Level) Data models
    • 컴퓨터에 데이터가 어떻게 파일 형태로 저장되는지를 기술할 수 있는 수단을 제공
    • Data Format, Data Orderings, Access Path 등
    • Access Path: 데이터 검색을 빠르게 하기 위한 구조체
      • ex) Index

Database Schema

Data Model을 바탕으로 Database의 구조를 기술한 것
notion image
  • Schema는 Database를 설계할 때 정해지며, 한번 정해진 후에는 자주 바뀌지 않는다.

Database State

  • Database에 있는 실제 데이터는 꽤 자주 바뀔 수 있다.
  • 특정 시점에 Database에 있는 데이터를 Database State or Snapshot이라 한다.
  • Database에 있는 현재 Instances의 집합이라고도 한다.

Three-Schema Architecture

Database System을 구축하는 Architecture 중 하나
notion image
  • User Application으로부터 물리적인(Physical) Database를 분리시키는 목적
    • 변화 발생 시, 레벨 사이에 매핑만 변경해주면 됨
  • 각 레벨을 독립시킴으로써 어느 레벨에서의 변화가 상위 레벨에 영항을 주지 않기 위함
  • 대부분의 DBMS가 Three Level을 완벽하게 or 명시적으로 나누지는 않음
  • 데이터가 존재하는 곳은 Internal Level
  • 세 가지 Level이 존재하며, 각각의 Level마다 Schema가 정의되어 있다.
    • External Schemas(or User Views)
      • 특정 유저들이 필요로 하는 데이터만 표현
      • 그 외 알려줄 필요 없는 데이터는 숨김
        • Logical Data Model을 통해 표현
    • Conceptual Schemas
      • 전체 Database에 대한 구조를 기술
      • 물리적인 저장 구조에 관한 내용은 숨김
      • Entities, Data Types, Relationships, User Operations, Constraints에 집중
        • Logical Data Model을 통해 기술
    • Internal Schemas
      • 물리적으로 데이터가 어떻게 저장되는지 Physical Data Model을 통해 표현
      • Data Storage, Data Structure, Access Path 등 실체가 있는 내용 기술

Database Language

Data Definition Language(DDL)

Conceptual Schema를 정의하기 위해 사용되는 언어
  • Internal Schema까지 정의할 수 있는 경우도 있음

Storage Definition Language(SDL)

Internal Schema를 정의하는 용도로 사용되는 언어
  • 요즘은 특히 Relational DBMS에서는 SDL이 거의 없고 파라미터 등의 설정으로 대체됨

View Definition Language(VDL)

External Schemas를 정의하기 위해 사용되는 언어
  • 대부분의 DBMS에서는 DDL이 VDL 역할까지 수행

Data Manipulation Language(DML)

Database에 있는 Data를 활용하기 위한 언어
  • Data 추가, 삭제, 수정, 검색 등의 기능을 제공하는 언어

통합된 언어

오늘날의 DBMS는 DML, VDL, DDL이 따로 존재하지 않고, 통합된 언어로 존재
  • 대표적인 예: Relational Database Language: SQL

데이터베이스의 특성

notion image
  • 실시간 접근
    • 사용자의 데이터 요구에 실시간으로 응답
  • 계속 변화
    • 데이터의 계속적인 삽입, 삭제, 수정을 통해 현재의 정확한 데이터를 유지
  • 동시 공유
    • 같은 데이터의 동시 사용 지원
  • 내용 기반 참조
    • 데이터가 저장된 주소나 위치가 아닌, 내용으로 참조
      • 연봉 5천 이상의 과장급 이상 사원 찾기

출처