데이터전환
1. 파일 처리 기술 개념
- 자료 구조 이론에서 파일처리 기술은 많은 양의 자료를 각종 매체에 저장하는 기법
- 파일을 하드디스크에 저장할 때 기억공간을 효율적으로 사용하고 필요한 자료의 탐색을 쉽게 하기 위해 파일을 효율적으로 처리하는 기술
- 종류
- 순차파일
- 색인 순차파일
- 가상 기억 접근방식 파일
- 직접파일
파일 처리 기술 종류
1. Sequential File 순차파일
- 입력되는 데이터들을 논리적인 순서에 따라 물리적 연속 공간에 순차적으로 기록하는 방식
- 급여 관리 등과 같이 변동 사항이 크지 않고 기간별로 일괄처리를 주로 하는 경우 적합
- 주로 순차 접근이 가능한 자기 테이프에 사용
- 장점
- 기록 밀도가 높아 기억공간을 효율적으로 사용
- 매체 변환이 쉬워 어떠한 매체에도 적용 가능
- 레코드를 기록할 때 사용한 키 순서대로 레코드를 처리하는 경우, 다른 편성법보다 처리속도가 빠름
- 단점
- 파일에 새로운 레코드를 삽입-삭제하는 경우 파일 전체를 복사해야하므로 시간이 많이 소요됨
- 데이터 검색 시 처음부터 순차적으로 검색하기 때문에 검색 효율이 낮음
2. Indexed Sequential File 색인 순차 파일
- 순차 처리와 랜덤 처리가 모두 가능하도록 레코드들을 키 값 순으로 정렬시켜 기록하고 레코드의 키 항목만을 모은 색인을 구성하여 편성하는 방식
- ISAM; Index Sequential Access Method 방법이라고도 함
- 레코드를 참조할 때 색인을 탐색한 후 색인이 가리키는 포인터를 사용하여 직접참조
- 자기 디스크에 많이 사용되며, 자기 테이프에는 사용 불가
- 장점
- 순차 처리와 랜덤 처리가 모드 가능하므로 목적에 따라 융통성 있게 처리 가능
- 효율적인 검색이 가능하고 레코드의 삽입, 삭제, 갱신이 용이함
- 단점
- 색인 구역과 오버플로 구역을 구성하기 위한 추가 기억 공간이 필요함
- 파일이 정렬되어 있어야 하므로 추가, 삭제가 많으면 효율이 떨어짐
- 색인을 이용한 액세스를 하기 때문에 액세스 시간이 랜덤 편서 파일보다 느림
3. VSAM; Virtual Storage Access Method 가상 기억 접근 방식 파일
- 동적 인덱스 방법을 이용한 색인 순차 파일
- 데이터 레코드가 저장되는 부분인 제어 구간, 몇 개의 제어 구간을 모아 놓은 제어 구역, 제어 구역에 대한 인덱스를 저장한 순차 세트, 순차 세트의 상위 인덱스의 인덱스 세트로 구성
- 레코드를 삭제하면 그 공간을 재사용 가능
- 제어 구간에 가변 길이 레코드를 쉽게 수용 가능
4. Direct File 직접 파일
- 파일을 구성하는 레코드를 특정 순서 없이 임의의 물리적 저장공간에 기록하는 것으로, 랜덤파일, DAM파일이라고 함
- 레코드에 특정 기준으로 키가 할당되며, 해시 함수를 이용하여 이 키에 대한 보조기억장치의 물리적 상대 레코드 주소를 계산한 후 해당하는 주소에 레코드를 저장
- 임의 접근이 가능한 자기 디스크나 자기 드럼에서 사용
- 데이터의 입출력이 빈번히 발생하는 곳에 응용
- 장점
- DSAD의 물리적 주소를 통하여 파일의 각 레코드에 직접 접근하거나 기록할 수 있으며, 접근 및 기록 순서에는 제약이 없음
- 접근 시간이 빠르고 레코드의 삽입, 삭제, 갱신이 용이
- 어떤 레코드라도 평균 접근시간 내에 검색가능
- 단점
- 레코드의 주소 변환 과정이 필요하며, 이 과정으로 인해 시간이 소요됨
- 기억공간의 효율이 저하될 수 있음
- 기억장치의 물리적 구조에 대한 지식이 필요하고 복잡함
- 충돌이 발생할 염려가 있으므로, 기억 공간의 확보가 필요