데이터전환
- 원천 데이터와 전환된 목적 데이터베이스 데이터의 품질을 분석하여 정상 데이터와 오류 데이터를 정량적으로 측정
- 발견된 오류를 분석하여 오류의 원인을 파악하고 원천 데이터와 응용 프로그램의 정제 필요 여부를 결정
- 정제가 필요한 원천 데이터와 오류를 생성하는 원천 프로그램을 수정하기 위한 데이터 정제요청서를 작성
- 정제된 원천 데이터를 확이하여 데이터 정제 수행 결과를 검증하고, 데이터 정제보고서를 작성
- 데이터 품질 분석 -> 오류 데이터 측정 -> 오류 데이터 정제
단계별 데이터 정제 방안
1. 1단계 전환 테스트 전
- 정합성 마비
- 데이터 상호 간의 정합성이 유지될 수 있도록 데이터 보관
- 조건
- 업무 규칙을 적용한 정당한 값 또는 데이터 선별
- 불필요한 데이터 필드
- 사용하는 데이터의 경우 매핑을 수행
- 사용하지 않을 경우에는 해당 테이블 삭제
- 손실된 데이터
- 손실된 데이터를 정당한 값으로 복원
- 조건
- 손실된 데이터의 정당한 값을 알아야 함
- 맞지 않는 타입
- 정당한 타입의 데이터로 수정
- 조건
- 해당 데이터를 정당한 타입의 필드로 이전
- 오류 데이터
- 오류 데이터를 정당한 데이터로 변경
- 불필요한 데이터를 삭제 또는 초기화
- 조건
- 정당한 데이터의 기준 정의
2. 2단계 전환 테스트 시
- 전환 테스트 결과 발견된 오류 데이터
- 사전에 업무 규칙을 적용하여 정의한 정당한 데이터 값으로 정비
- 동일한 타입으로 전환
- 1단계 정제 대상 항목의 정제 내용과 동일하게 정제
- 조건
- 테스트 결과를 이용하여 정제 조건 결정
- 테스트 수행 과정에서 정제 대상 리스트 제시
3. 3단계 최종 전환
- 최종 전환 과정에서 정제
- 매핑 정의서에 작성된 전환 규칙을 이용하여 전환 프로그램에 해당 내용 추가하여 프로그램 수행 시 정제
- 조건
- 테스트 결과를 이용하여 정제 조건 결정
- 사전에 매핑 과정에서 정제 대상 및 정제 조건을 명확하게 제시