데이터전환
원천 데이터 품질 분석의 개념
- 원천 데이터의 품질이 보장되지 않으면 전환 후의 데이터도 정확하지 않으며, 전환 후의 데이터 정합성 검증 시 오류가 발생할 때 그 원인을 찾기도 어려움
- 따라서 전환 전에 원천 데이터의 품질을 검증함으로써 전환의 정확성을 보장할 수 있으며, 이전에 미처 발견하지 못한 데이터의 오류도 찾아낼 수 있음
원천 데이터 품질 검증을 위한 대표적인 정합성 항목
- 필수 항목의 데이터가 모두 존재하는가?
- 데이터의 유형이 정확하게 관리되고 있는가?
- 날짜의 경우 날짜로서 유효한 형태를 가지고 있는가?
- 금액의 경우 유효한 값의 범위인가?
- 계좌 번호 등이 정해진 법칙에 따른 번호인가?
- 영업점이 실제로 존재하는 영업점인가?
- 코드 값이 정해진 범위에 속하는가?
- 개설 일자, 해지 일자 등 모든 일자의 시점이 업무 규칙에 위배되지 않고 정확하게 설정되어 있는가?
- 업무 규칙에 위배되는 잘못된 정보가 존재하는가?
- 잔액의 총합이 회계정보와 동일한가?
- 보고서 값과 실제 데이터 값이 일치하는가?
목적 데이터 품질 분석
- 원천 데이터와 목적 데이터베이스 속성(Column)간 대응 관계는 1:1대응보다 N:M대응 관계가 더 많기 때문에 양자 간의 대응 관계를 정확히 표현하기 위해서는 데이터 레이아웃을 정확하게 파악하고 품질 검증 진행
목적 데이터베이스 전환 데이터 검증 고려 사항
- 현재 업무에서 사용하는 보고서나 통계용 정보를 사전에 조사하여 검증에 필요한 내용을 선정하고, 현재의 원장을 바탕으로 검증용 정보 도출
- 전환 데이터 검증은 데이터 전환 팀 인원 뿐만 아니라, 현업 인원도 함께 검증을 수행함으로써 검증의 정확성을 높이고 시간을 단축시키는 것이 중요함
전환 데이터의 대표적인 정합성 검증 항목
- 과목별 좌수 및 잔액
- 특정 기준으로 분류된 좌수 및 잔액
- 보고서 항목 또는 통계 수치
- 계좌 및 고객을 Sampling하여 해당 사항을 모두 검증
- 특수 관계가 있는 고객을 추출하여 관련된 데이터가 정확한지 검증