IT프로젝트정보시스템구축관리
DB구축관리
- 데이터베이스와 관련된 IT신기술의 종류와 특징을 이해
- 데이터베이스 관리 기능으로 회복과 병행제어의 개념 이해
- 데이터베이스 표준화의 개념과 구성요소를 이해
용어사전
- 데이터 표준화
- 시스템을 구성하는 데이터 요소의 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하고 적용하는 것
DB 관련 신기술
1. Big Data 빅데이터
- 기존의 관리 방법이나 분석체계로는 처리하기 어려운 막대한 양의 정형 또는 비정형 데이터의 집합으로 스마트 단말기의 빠른 확산, 소셜 네트워크 서비스의 활성화, 사물 네트워크의 확대로 데이터 폭발이 가속화됨
- 3가지 특징
- Volume 데이터의 양
- Velocity 데이터 생성 속도
- Variety 형탱의 다양성
2. Broad Data 브로드 데이터
- 다양한 채널에서 소비자의 상호 작용을 통해 생성된 기업 마케팅에 있어 효율적이고 다양한 데이터이며, 이전에 사용하지 않거나 알지 못했던 새로운 데이터나 기존 데이터에 가치가 더해진 데이터
- 다양한 정보를 뜻하는 것으로 소비자의 SNS 활동이나 위치 정보 등이 이에 속함
3. Digital Archiving
- 늘어나는 정보 자원의 효율적인 관리와 이용을 위해 디지털 정보 자원을 장기적으로 보존하기 위한 작업
- 아날로그 콘텐츠는 디지털로 변환한 후 압축해서 저장하고, 디지털 콘텐츠도 체계적으로 분류하고 메타 데이터를 만들어 DB화 하는 작업
4. Meta Data 메타 데이터
- 일련의 데이터를 정리하고 설명해주는 데이터
- 메타 데이터는 여러 용도로 사용되나 주로 빠르게 검색하거나 내용을 간략화하고 체계적으로하기 위해 많이 사용
5. Data Diet 데이터 다이어트
- 데이터를 삭제하는 것이 아니라 압축하고, 중복된 정보는 중복을 배재하고 새로운 기준에 따라 나누어 저장하는 작업
- 인터넷과 이동통신 이용이 늘면서 각 기관/기업의 데이터베이스에 쌓인 방대한 정보를 효율적으로 관리하기 위해 대두된 방안으로 같은 단어가 포함된 데이터들을 한 곳에 모다 두되 필요할 때 제대로 찾아내는 체계를 갖추는 것이 필요
6. Hadoop 하둡
- 오픈 소스를 기반으로 한 분산 컴퓨팅 플랫폼
7. Tajo 타조
- 오픈 소스 기반 분산 컴퓨팅 플랫폼인 아파치 하둡 기반의 분산 데이터 웨어하우스 프로젝트로 우리나라가 주도하여 개발
- 데이터웨어하우스
- 자료와 창고의 합성어로기업의 의사결정과정에 효과적으로 사용할 수 있또록 에러시스템에 분산되어 있는 데이터를 주체별로 통합축적해 놓은 데이터베이스
- 데이터웨어하우스
- 대규모 데이터 처리와 실시간 상호 분석 모두 사용 가능