물리데이터베이스 - 핵심정리

물리데이터베이스

1. 파티셔닝

  • 데이터베이스에서 파티션은 대용량의 테이블이나 인덱스를 작은 논리적 단위인 파티션으로 나누는 것
  • 장점
    • 데이터 접근 시 액세스 범위를 줄여 쿼리 성능이 향상됨
    • 파티션별로 데이터가 분산되어 저장되므로 디스크의 성능이 향상됨
    • 파티션별로 백업 및 복구를 수행하므로 속도가 빠름
    • 시스템 장애 시 데이터 손상 정도를 최소화
    • 데이터 가용성이 향상됨
    • 파티션 단위로 입/출력을 분산시킬 수 있음
  • 단점
    • 하나의 테이블을 세분화하여 관리하므로 세심한 관리가 요구됨
    • 테이블간 조인에 대한 비용이 증가함
    • 용량이 작은 테이블에 파티셔닝을 수행하면 오히려 성능이 저하됨
  • 종류
    • 범위 분할
    • 해시 분할
    • 조합 분할

2. 클러스터링

  • 데이터 저장시 데이터 액세스 효율을 향상시키기 위해 동일한 성격의 데이터를 동일한 데이터 블록에 저장하는 물리적 저장 방법
  • 클러스터 대상 테이블
    • 분포도가 넓은 테이블
    • 대량의 범위를 자주 조회하는 테이블
    • 입력, 수정, 삭제가 자주 발생하지 않는 테이블
    • 자주 조인되어 사용되는 테이블
    • ORDER BY, GROUP BY, UNION이 빈번한 테이블

3. 데이터베이스 백업

  • 데이터베이스 백업은 전산 장비의 장애에 대비하여 데이터베이스에 저장된 데이터를 보호하고 복구하기 위한 작업
  • 로그 파일
    • 데이터베이스의 처리 내용이나 이용 상황 등 상태 변화를 시간의 흐름에 따라 모두 기록한 파일
  • 데이터베이스 복구 알고리즘
    • NO-UNDO/REDO
    • UNDO/NO-REDO
    • UNDO/REDO
    • NO-UNDO/NO-REDO
  • 백업 종류
    • 물리 백업
    • 논리 백업

4. 데이터베이스 용량 설계

  • 데이터베이스 용량을 설계할 때는 테이블에 저장할 데이터양과 인덱스, 클러스터 등이 차지하는 공간 등을 예측하여 반영함
  • 데이터베이스의 용량을 정확히 산정하여 디스크의 저장 공간을 효과적으로 사용하고 확장성 및 가용성을 높임
  • 테이블스페이스 설계 시 고려사항
    • 테이블스페이스는 업무별로 구분하여 지정
    • 대용량 테이블은 하나의 테이블스페이스에 독립적으로 저장
    • 테이블과 인덱스는 분리하여 저장
    • LOB(Large Object)타입의 데이터는 독립적인 공간으로 지정

5. 데이터 지역화 Locality

  • 데이터베이스의 저장 데이터를 효율적으로 이용할 수 있도록 저장하는 방법
  • 물리적 데이터베이스 설계, 보조 기억 장치의 역할, 디스크 상의 파일의 배치를 지역화 관점에서 검토

물리데이터베이스 - 데이터지역화

물리데이터베이스

데이터 지역화 Data Locality 개념

  • 데이터베이스의 저장 데이터를 효율적으로 이용할 수 있도록 저장하는 방법
  • 물리적 데이터베이스 셀계에서 데이터 지역화를 고려한 보조 저장장치의 설계가 중요
  • 물리적 데이터베이스 설계, 보조 기억 장치의 역할, 디스크 상의 파일의 배치를 지역화 관점에서 검토

물리적 데이터베이스 설계

  • 논리적 설계의 데이터 구조보조 기억 장치상의 파일(물리적 데이터 모델)로 매핑
  • 하나의 파일에 여러 릴레이션이 저장될 수 있음
  • 예상 빈도를 포함하여 데이터베이스 질의와 트랜잭션을 분석
  • 데이터에 대한 효율적인 접근을 제공하기 위하여 저장 구조와 접근 방법들을 고려함
  • 질의를 효율적으로 지원하기 위해 인덱스 구조를 적절히 사용함

보조 기억 장치의 역할

  • 각 파일은 고정된 크기의 블록들로 나누어져 저장됨
  • 여러 개의 블록들에 파일의 데이터가 분산되어 저장됨
  • 디스크는 데이터베이스를 장기간 보관하는 주된 보조 기억장치

디스크상에서 파일의 레코드 배치

  • 릴레이션의 속성은 고정 길이 또는 가변 길이의 필드로 표현됨
  • 연관된 필드들이 모여서 고정 길이 또는 가변 길이의 레코드가 됨
  • 한 릴레이션을 구성하는 레코드들의 모임은 파일이라고 부르는 블록들의 모임에 저장
  • 한 파일에 속하는 블록들의 위치가 반드시 인접해 있을 필요는 없음
  • 인접한 블록들을 읽는 경우 탐구 시간과 회전 지연 시간이 들지 않기 때문에 입출력 속도가 빠르므로 블록들이 인접하도록 파일의 블록들을 재조직

물리데이터베이스 - 데이터베이스 용량 설계

물리데이터베이스

데이터베이스 용량 설계 개념

  • 데이터베이스 용량 설계는 데이터가 저장될 공간을 정의
  • 데이터베이스 용량을 설계할 때는 테이블에 저장할 데이터양과 인덱스, 클러스터 등이 차지하는 공간 등을 예측하여 반영함
  • 설계과정에서 수행

Tablespace 테이블 스페이스

  • 테이블이 저장되는 논리적인 영역으로, 하나의 테이블스페이스에 하나 또는 그 이상의 테이블 저장 가능
  • 테이블을 저장하면 논리적으로는 테이블스페이스에 저장되고, 물리적으로는 해당 테이블스페이스와 연관된 데이터 파일에 저장
  • 데이터베이스를 테이블, 테이블스페이스, 데이터 파일로 나눠 관리하면 논리적 구성이 물리적 구성에 종속되지 않아 투명성이 보장됨
  • 테이블스페이스는 데이터베이스에 저장되는 내용에 따라 테이블, 인덱스, 임시(Temporary) 등의 용도로 구분하여 설계
  • 테이블스페이스 설계 시 고려사항
    • 테이블스페이스는 업무별로 구분하여 지정
    • 대용량 테이블은 하나의 테이블스페이스에 독립적으로 저장
    • 테이블과 인덱스는 분리하여 저장
    • LOB(Large Object)타입의 데이터는 독립적인 공간으로 지정

데이터베이스 용량 설계 목적

  • 데이터베이스의 용량을 정확히 산정하여 디스크의 저장 공간을 효과적으로 사용하고 확장성 및 가용성을 높임
  • 디스크의 특성을 고려하여 설계함으로써 디스크의 입/출력 부하를 분산시키고 채널의 병목 현상을 최소화
  • 디스크에 대한 입/출력 경합이 최소화되도록 설계함으로써 데이터 접근성 향상
    • 테이블과 인덱스의 테이블스페이스를 분리 구성
    • 테이블스페이스와 임시 테이블스페이스를 분리 구성
    • 테이블을 마스터 테이블과 트랜잭션 테이블로 분류
  • 데이터베이스의 기본 용량이 모두 찼을 경우 추가적으로 공간이 할당되는 익스텐트(Extent) 발생을 최소화하여 성능 향상
  • 데이터베이스 용량을 정확히 분석하여 테이블과 인덱스에 적합한 저장 옵션 지정

데이터베이스 용량 분석 절차

  1. 데이터 예상 건수, Row 길이, 보존 기간, 증가율 등 기초 자료를 수집하여 용량을 분석
  2. 분석된 자료를 바탕으로 DBMS에 이용될 테이블, 인덱스 등 오브젝트별 용량을 산정
  3. 테이블과 인덱스의 테이블스페이스 용량을 산정
  4. 데이터베이스에 저장될 모든 데이터 용량과 데이터베이스 설치 및 관리를 위한 시스템 용량을 합해 디스크 용량을 산정
API API오용 Anaconda Beacon Bluetooth CRUD분석 Camera ChatBot DB관련신기술 DB관리기능 DB서버 DB표준화 ER다이어그램 ER모델 ETL Flask HW관련신기술 IDE도구 IP IoT Machine_Translation NLP배경 ORM프레임워크 Package Recurrent Neural Network SDLC SW개발방법론 SW개발방법론선정 SW개발보안정책 SW개발표준 SW관련신기술 Sequence_Tagging ShellScript TCP_UDP Vector WordCloud c 자료형 class embedding konlpy python python 자료형 가설검증 개발환경구축 객체지향프로그래밍언어 관계데이터베이스모델 관계데이터언어 국제표준제품품질특성 네트워크7계층 네트워크관련신기술 네트워크장비 네트워크침해공격용어 논리데이터모델개요 논리데이터모델품질검증 논리적데이터모델링 논문 단위모듈구현 단위모듈테스트 데이터검증 데이터모델개념 데이터베이스무결성 데이터베이스백업 데이터베이스암호화 데이터베이스용량설계 데이터베이스이중화구성 데이터베이스정규화 데이터분석 데이터분석 - 순열 - 조합 데이터분석 - 정규분포 데이터분석 - 통계기초 데이터사이언스개념 데이터입출력 데이터전환수행계획 데이터정제 데이터조작프로시저작성 데이터조작프로시저최적화 데이터조작프로시저테스트 데이터지역화 데이터타입 데이터표준확인 데이터품질분석 라이브러리 로그분석 메모리관리 모델화 몬테카를로 물리데이터모델설계 물리데이터모델품질기준 물리데이터저장소구성 물리요소조사분석 반정규화 배치프로그램 변수 보안기능 보안솔루션 보안아키텍처 보안취약성식별 분산데이터베이스 분산분석 비용산정모델 빌드자동화도구 사용자정의함수 상관분석 서버개발프레임워크 서버인증 서버장비운영 서버접근통제 서비스공격유형 선언형언어 세션통제 소스코드인스펙션 소프트스킬 소프트웨어개발프레임워크 소프트웨어버전관리도구 소프트웨어연계테스트 슈퍼디엠지 스크립트언어 시스템카탈로그와뷰 암호알고리즘 애플리케이션모니터링도구 애플리케이션배포도구 애플리케이션성능개선 애플리케이션테스트결과분석 애플리케이션테스트시나리오작성 애플리케이션테스트케이스작성 애플리케이션통합테스트수행 애플리케이션패키징 연산자 예외처리 오답노트 오류데이터측정 오류처리 오류처리확인및보고서작성 요구공학방법론 운영체제 웹서버 이벤트 인터넷구성의개념 인터페이스구현검증 인터페이스기능확인 인터페이스보안 입력데이터검증및표현 자료구조 자연어처리 재사용 절차적프로그래밍언어 정보보안침해공격용어 정보처리기사 제품소프트웨어매뉴얼작성 집계성DCL작성 체크리스트 초기데이터구축 취약점분석 칼럼속성 캡슐화 코드오류 클러스터링 키종류 테일러링기준 트랜잭션인터페이스 트리거 파일처리기술 파티셔닝 패키지 포트포워딩 프로세스스케줄링 프로토타입 한국어임베딩 핵심정리 현업도구 형상관리도구 환경변수 회귀분석
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×