물리데이터베이스 - 데이터베이스백업

물리데이터베이스

데이터베이스 백업 개념

  • 데이터베이스 백업은 전산 장비의 장애에 대비 하여 데이터베이스에 저장된 데이터를 보호하고 복구하기 위한 작업
  • 치명적인 데이터 손실을 막기 위해서는 데이터베이스를 정기적으로 백업
  • 데이터베이스 관리 시스템은 데이터베이스 파괴 및 실행 중단이 발생하면 이를 복구할 수 있는 기능을 제공함

데이터베이스 장애 유형

  • 사용자 실수
    • 사용자 실수로 인해 테이블이 삭제되거나 잘못된 트랜잭션이 처리된 경우
  • 미디어 장애
    • CPU, 메모리, 디스크 등 하드웨어 장애나 데이터가 파손
  • 구문 장애
    • 프로그램 오류나 사용 공간의 부족으로 인해 발생하는 장애
  • 사용자 프로세스 장애
    • 프로그램이 비정상적으로 종료되거나 네트워크 이상으로 세션이 종료되어 발생하는 오류
  • 인스턴스 장애
    • 하드웨어 장애, 정전, 시스템 파일 파손 등 비정상적인 요인으로 인해 메모리나 데이터베이스 서버의 프로세스가 중단

로그 파일

  • 로그 파일은 데이터베이스의 처리 내용이나 이용 상황상태 변화를 시간의 흐름에 따라 모두 기록한 파일
  • 데이터베이스 복구를 위해 필요한 가장 기본적인 자료
  • 로그 파일을 기반으로 데이터베이스를 과거 상태로 복귀(UNDO)시키거나 현재 상태로 재생(REDO)시켜 데이터베이스 상태를 일관성 있게 유지
  • 로그 파일은 트랜잭션 시작 시점, Rollback 시점, 데이터 입력, 수정, 삭제 시점 등에서 기록
  • 로그 파일 내용
    • 트랜잭션이 작업한 모든 내용, 트랜잭션 식별, 트랜잭션 레코드, 데이터 식별자, 갱신 이전 값(Before Image), 갱신 이후 값(After Image) 등

데이터베이스 복구 알고리즘

1. NO-UNDO/REDO

  • 데이터베이스 버퍼의 내용을 비동기적으로 갱신한 경우의 복구 알고리즘
  • NO-UNDO : 트랜잭션 완료 전에는 변경 내용이 데이터베이스에 기록되지 않으므로 취소할 필요가 없음
  • REDO : 트랜잭션 완료 후 데이터베이스 버퍼에는 기록되어 있고, 저장매체에는 기록되지 않으므로 트랜잭션을 다시 실행

2. UNDO/NO-REDO

  • 데이터베이스 버퍼의 내용을 동기적으로 갱신한 경우의 복구 알고리즘
  • UNDO : 트랜잭션 완료 전에 시스템이 파손되었다면 변경된 내용 취소
  • NO-REDO : 트랜잭션 완료 전에 데이터베이스 버퍼 내용을 이미 저장매체에 기록했으므로 트랜잭션 내용을 다시 실행하지 않음

3. UNDO/REDO

  • 데이터베이스 버퍼의 내용을 동기/비동기적으로 갱신한 경우의 복구 알고리즘
  • 데이터베이스 기록 전에 트랜잭션이 완료될 수 있으므로 완료된 트랜잭션이 데이터베이스에 기록되지 못했다면 다시 실행

4. NO-UNDO/NO-REDO

  • 데이터베이스 버퍼의 내용을 동기적으로 저장 매체에 기록하지만 데이터베이스와는 다른 영역에 기록한 경우의 복구 알고리즘
  • NO-UNDO : 변경 내용은 데이터베이스와 다른 영역에 기록되어 있으므로 취소할 필요가 없음
  • NO-REDO : 다른 영역에 이미 기록되어 있으므로 트랜잭션을 다시 실행할 필요 없음

백업종류

1. 물리 백업

  • 데이터베이스 파일을 백업하는 방법
  • 백업 속도가 빠르고 작업이 단순하지만 문제 발생시 원인 파악 및 문제 해결이 어려움
  • 완전 복구 가능

2. 논리 백업

  • DB 내의 논리적 객체들을 백업하는 방법
  • 복원 시 데이터 손상을 막고 문제 발생 시 원인 파악 및 해결이 수월하지만 백업/복원 시 시간이 많이 소요됨
구분 설명 복구수준
물리백업 로그 파일 백업 실시 완전 복구
물리백업 로그 파일 백업 없음 백업 시점까지 복구
논리 백업 DBMS 유틸리티 백업 시점까지 복구

물리데이터베이스 - 클러스터링

물리데이터베이스

Cluster 클러스터의 개념

  • 데이터 저장시 데이터 액세스 효율을 향상시키기 위해 동일한 성격의 데이터를 동일한 데이터 블록에 저장하는 물리적 저장 방법
  • 클러스터링키로 지정된 컬럼 값의 순서대로 저장되고, 여러 개의 테이블이 하나의 클러스터에 저장됨

클러스터의 특징

  • 클러스터링 된 테이블은 데이터 조회 속도는 향상시키지만 데이터 입력, 수정, 삭제에 대한 성능은 저하됨
  • 클러스터는 데이터의 분포도가 넓을수록 유리함
  • 데이터 분포도가 넓은 테이블을 클러스터링 하면 저장 공간을 절약할 수 있음
  • 대용량을 처리하는 트랜잭션은 전체 테이블을 스캔하는 일이 자주 발생하므로 클러스터링을 하지 않는 것이 좋음
  • 처리 범위가 넓은 경우에는 단일 테이블 클러스터링을, 조인이 많이 발생하는 경우는 다중 테이블 클러스터링을 사용
  • 파티셔닝된 테이블에는 클러스터링 불가
  • 클러스터링된 테이블에 클러스터드 인덱스를 생성하면 접근 성능 향상

클러스터 대상 테이블

  • 분포도가 넓은 테이블
  • 대량의 범위를 자주 조회하는 테이블
  • 입력, 수정, 삭제가 자주 발생하지 않는 테이블
  • 자주 조인되어 사용되는 테이블
  • ORDER BY, GROUP BY, UNION이 빈번한 테이블

물리데이터베이스 - 파티셔닝

물리데이터베이스

  • 식별된 오브젝트의 데이터 타입, 사이즈, 증가 용량을 고려하여 저장 공간을 산출하고, 해당 오브젝트에 대한 테이블 스페이스를 할당

  • 할당된 테이블 스페이스 용량을 기반으로 디스크 저장 용량을 산정하고, 데이터베이스 백업 주기, 방식에 따른 별도 저장 공간 용량을 산정

  • 분산위치, 엔티티명, 테이블명, 테이블 스페이스명, 테이블 스페이스 용량, 데이터 파일명, 파티셔닝, 클러스터링 정보, 보안정보에 대한 물리 데이터베이스 설계서를 작성

Partition 파티션 개념

  • 데이터베이스에서 파티션은 대용량의 테이블이나 인덱스를 작은 논리적 단위인 파티션으로 나누는 것
    • 대용량 데이터베이스의 경우 중요한 몇 개의 테이블에만 집중되어 데이터가 증가되므로 이런 테이블을 작은 단위로 나눠 분산시키면 성능 저하를 방지와 데이터 관리가 쉬워짐
    • 테이블이나 인덱스를 파티셔닝하면 파티션키 또는 인덱스키에 따라 물리적으로 별도의 공간에 데이터가 저장됨
    • 데이터 처리는 테이블 단위로 이뤄지고 데이터 저장은 파티션별로 수행

파티션 장/단점

  • 장점
    • 데이터 접근 시 액세스 범위를 줄여 쿼리 성능이 향상됨
    • 파티션별로 데이터가 분산되어 저장되므로 디스크의 성능이 향상됨
    • 파티션별로 백업 및 복구를 수행하므로 속도가 빠름
    • 시스템 장애 시 데이터 손상 정도를 최소화
    • 데이터 가용성이 향상됨
    • 파티션 단위로 입/출력을 분산시킬 수 있음
  • 단점
    • 하나의 테이블을 세분화하여 관리하므로 세심한 관리가 요구됨
    • 테이블간 조인에 대한 비용이 증가함
    • 용량이 작은 테이블에 파티셔닝을 수행하면 오히려 성능이 저하됨

파티션의 종류

1. Range Partitioning 범위 분할

  • 지정한 열의 값을 기준을 분할
    • 일별, 월별, 분기별

2. Hash Partitioning 해시 분할

  • 해시 함수를 적용한 결과 값에 따라 데이터를 분할
  • 특정 파티션에 데이터가 집중되는 범위 분할의 단점을 보완한 것으로 데이터를 고르게 분산할 때 유용함
  • 특정 데이터가 어디에 있는지 판단할 수 없음
  • 고객번호, 주민번호 등과 같이 데이터가 고른 컬럼에 효과적임

3. Composite Partitoning 조합 분할

  • 범위 분할로 분할한 다음 해시 함수를 적용하여 다시 분할하는 방식
  • 범위 분할한 파티션이 너무 커서 관리가 어려울 때 유용함

파티션키 선정시 고려사항

  • 파티션키는 테이블 접근 유형에 따라 파티셔닝이 이뤄지도록 선정
  • 데이터 관리의 용이성을 위해 이력성 데이터는 파티션 생성주기와 소멸주기를 일치
  • 매일 생성되는 날짜 컬럼, 백업의 기준이 되는 날짜 컬럼, 파티션 간 이동이 없는 컬럼, I/O 병목을 줄일 수 있는 데이터 분포가 양호한 컬럼 등을 파티션키로 선정
API API오용 Anaconda Beacon Bluetooth CRUD분석 Camera ChatBot DB관련신기술 DB관리기능 DB서버 DB표준화 ER다이어그램 ER모델 ETL Flask HW관련신기술 IDE도구 IP IoT Machine_Translation NLP배경 ORM프레임워크 Package Recurrent Neural Network SDLC SW개발방법론 SW개발방법론선정 SW개발보안정책 SW개발표준 SW관련신기술 Sequence_Tagging ShellScript TCP_UDP Vector WordCloud c 자료형 class embedding konlpy python python 자료형 가설검증 개발환경구축 객체지향프로그래밍언어 관계데이터베이스모델 관계데이터언어 국제표준제품품질특성 네트워크7계층 네트워크관련신기술 네트워크장비 네트워크침해공격용어 논리데이터모델개요 논리데이터모델품질검증 논리적데이터모델링 논문 단위모듈구현 단위모듈테스트 데이터검증 데이터모델개념 데이터베이스무결성 데이터베이스백업 데이터베이스암호화 데이터베이스용량설계 데이터베이스이중화구성 데이터베이스정규화 데이터분석 데이터분석 - 순열 - 조합 데이터분석 - 정규분포 데이터분석 - 통계기초 데이터사이언스개념 데이터입출력 데이터전환수행계획 데이터정제 데이터조작프로시저작성 데이터조작프로시저최적화 데이터조작프로시저테스트 데이터지역화 데이터타입 데이터표준확인 데이터품질분석 라이브러리 로그분석 메모리관리 모델화 몬테카를로 물리데이터모델설계 물리데이터모델품질기준 물리데이터저장소구성 물리요소조사분석 반정규화 배치프로그램 변수 보안기능 보안솔루션 보안아키텍처 보안취약성식별 분산데이터베이스 분산분석 비용산정모델 빌드자동화도구 사용자정의함수 상관분석 서버개발프레임워크 서버인증 서버장비운영 서버접근통제 서비스공격유형 선언형언어 세션통제 소스코드인스펙션 소프트스킬 소프트웨어개발프레임워크 소프트웨어버전관리도구 소프트웨어연계테스트 슈퍼디엠지 스크립트언어 시스템카탈로그와뷰 암호알고리즘 애플리케이션모니터링도구 애플리케이션배포도구 애플리케이션성능개선 애플리케이션테스트결과분석 애플리케이션테스트시나리오작성 애플리케이션테스트케이스작성 애플리케이션통합테스트수행 애플리케이션패키징 연산자 예외처리 오답노트 오류데이터측정 오류처리 오류처리확인및보고서작성 요구공학방법론 운영체제 웹서버 이벤트 인터넷구성의개념 인터페이스구현검증 인터페이스기능확인 인터페이스보안 입력데이터검증및표현 자료구조 자연어처리 재사용 절차적프로그래밍언어 정보보안침해공격용어 정보처리기사 제품소프트웨어매뉴얼작성 집계성DCL작성 체크리스트 초기데이터구축 취약점분석 칼럼속성 캡슐화 코드오류 클러스터링 키종류 테일러링기준 트랜잭션인터페이스 트리거 파일처리기술 파티셔닝 패키지 포트포워딩 프로세스스케줄링 프로토타입 한국어임베딩 핵심정리 현업도구 형상관리도구 환경변수 회귀분석
Your browser is out-of-date!

Update your browser to view this website correctly. Update my browser now

×