데이터 표준화의 정의
데이터 표준화 : 시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 이를 전사적으로 적용하는 것
- 데이터 명칭
- 유일성 : 하나의 개념에 대해 모든 사용자가 통일된 용어를 사용할 수 있도록 하나의 명칭만을 허용 (ex : email, email 주소 -> email 주소로 통일)
- 업무적 관점의 보편성 : 데이터 명칭은 업무적 관점에서 보편적으로 인지되는 이름이어야 한다. 조직 구성원들이 해당 개념을 지칭할때 가장 많이 사용하는 업무 용어를 그대로 사용하는 것이 바람직하다
- 의미 전달의 충분성 : 데이터 명칭은 이름만으로 데이터의 의미 및 범위가 파악될 수 있어야 한다. 업무나 사용자의 관점에 따라 의미가 달라질 수 있는 이름은 수식어 등을 사용함으로써 구체화하는 것이 좋다.
- 데이터 정의 : 데이터 정의는 해당 데이터가 의미하는 범위 및 자격 요건을 규정하는 것
- 업무 관점에서 범위와 자격 요건을 명시, 데이터 명칭만으로는 사용자에게 전달하기 어려운 기타 사항들을 전달하는 역할을 하고, 데이터 소유자를 결정하는 기준이 된다.
- 데이터 사용자가 데이터의 의미를 잘 이해할 수 있도록 관련 업무를 모르는 제 3자의 입장에서 기술한다.
- 서술식 정의만으로 데이터의 의미 전달이 어려울 경우에 실제 발생할 수 있는 데이터의 값도 같이 기술한다.
- 데이터 명칭을 그대로 서술하거나 약어 또는 전문 용어를 이용한 정의 기술은 가급적 사용하지 않는다.
- 데이터 형식 : 표현 형태의 정의를 통해 데이터 입력 오류와 통제 위험을 최소화하는 역할을 한다.
- 데이터 타입(Numeric, Text, Date 등)
- 데이터 길이 및 소수점 자리
- 도메인을 정의하여 데이터 표준에 적용함으로써 성격이 유사한 데이터 간의 데이터 형식을 통일한다.
- 데이터의 최댓값 또는 최대 길이가 고정되어 있지 않을 경우 충분히 여유 있게 정의한다.
- 특수 데이터 타입(CLOB, Long Raw 등)은 데이터 조회, 백업, 이행 등에 있어서 제약 사항이 존재하는 경우가 많기 때문에 가급적 사용하지 않는다.
- 데이터 규칙 : 데이터 규칙은 발생 가능한 데이터 값을 사전에 정의함으로써 데이터의 입력 오류와 통제 위험을 최소화하는 역할을 한다. 정합성 및 완전성을 향상할 수 있다.
- 기본 값 : 데이터 값의 입력을 생략했을 경우 자동으로 입력되는 데이터 값
- 허용 값 : 업무 규칙과 일관성을 갖도록 입력이 가능한 데이터 값을 제한
- 허용 범위 : 업무 규칙과 일관성을 갖도록 입력이 가능한 데이터 값을 범위로 제한함
데이터 표준화 구성요소
데이터 표준화 구성요소 : 전사적인 데이터 표준화를 추진하기 위해 수집해야 할 표준화 구성요소는 데이터 표준, 데이터 표준관리 조직, 데이터 표준화 절차이다.
- 데이터 표준
데이터 표준화는 기본적으로 모든 객체를 대상으로 수행하는 것이 이상적이지만, 주로 관리해야 될 필요성이 있는 객체만을 대상으로 데이터 표준화하는 것이 효율적이다. 그 대상에는 용어, 단어, 도메인, 코드가 있다
- 표준 용어 : 업무적으로 사용하는 용어에 대한 표준을 정의함으로써 용어 사용 및 적용에 대한 혼란을 방지하고 원활한 커뮤니케이션을 촉진한다. 표준 용어는 업무적 용어와 기술적 용어가 있다.
- 표준 단어 : 표준 용어를 구성하는 단어에 대한 표준을 정의함으로써 용어에 대한 한글명과 영문명을 일관되게 정의할 수 있게 한다.
* 표준 단어를 관리함으로써 동일한 개념을 의미하는 용어의 생성을 예방한다.
* 표준 용어는 영문명 작성 기준이 된다 -> 테이블 및 컬럼의 한글명만 작성하면 영문명은 표준 단어에 의해 자동으로 결정된다. - 표준 도메인 : 컬럼에 대한 성질을 그룹핑한 개념이다. 도메인은 크게는 문자형/숫자형/일자형/시간형, 세부적으로는 명/주소/ID , 금액/율/수량 등으로 분류할 수 있다.
- 표준 코드 : 도메인의 한 유형으로, 특정 도메인 값이 이미 정의되어 있는 도메인이다. 코드에 대한 표준은 다른 값과는 달리 코드 값까지 미리 정의해야 한다.
- 기타 데이터 표준 관련 요소 : 데이터 모델에서 정의하는 주제 영역, 관계명, 데이터베이스, 데이터베이스 스키마, 테이블, TABLESPACE, INDEX, CONSTRAINT 등에 대한 표준을 관리한다.
- 데이터 표준 관리 조직 : 전사적으로 수립된 데이터 표준 원칙, 데이터 표준, 데이터 표준 준수 여부 관리 등을 위해서는 DA의 역할이 요구된다.
- 데이터 관리자 주요 역할
- 데이터에 대한 정책과 표준 정의 : 데이터에 대한 표준화 원칙 및 표준을 정의한다. 표준에 대한 변경과 추가 발생 시에 최종적으로 승인 의사결정을 수행하며, 기업 내에 산재된 시스템에 대한 데이터 표준 준수 여부를 주기적으로 체크하여 지속적인 표준 관리 활동을 수행한다.
- 부서 간 데이터 구조 조율 : 데이터 관리자는 전사 데이터 관리 기준에 의거하여 단위 시스템이나 조직 부처에 명확한 데이터 관리 기준을 제시하고, 부서 간 데이터 구조에 대한 이견 발생 시에 전사 데이터 관리 관점에서 데이터 구조를 제시하여 체계적인 데이터 구조 관리가 이루어지는 역할을 수행한다.
- 데이터 보안 관리 : 데이터에 대한 보안 정책 수립, 보안 정책 준수 여부 체크, 보안 시정 조치 요구 등을 수행한다.
- 데이터 모델 관리 : 데이터에 대한 중요한 의사소통의 도구가 되는 데이터 모델을 물리적인 변경 시점에 동일하게 관리함으로써 향후 데이터 활용에 대한 업무 협의 시 신속한 의사결정이 이루어지도록 관리한다.
- 데이터의 효율적인 활용 방안 계획 : 데이터가 전사적으로 공유되어 효율적으로 활용되도록 지속적으로 데이터 활용상의 문제점 등을 체크하여 데이터 활용과 관련된 방안을 수립하여 시행한다.
- 데이터 관리자 세부 역할
- 전사 데이터 관리자 : 데이터 표준화에 대한 정책 결정, 검토한 데이터 표준 제안에 대한 승인
- 업무 데이터 관리자 : 담당 업무 기능의 데이터 요구 사항 반영을 위해 필요한 데이터 표준 정의, 업무 관련 데이터 표준 변경 제안에 대한 합동 검토
- 업무 시스템 데이터 관리자 : 시스템 관리 목적의 데이터 요구 사항을 위해 필요한 데이터 표준 정의, 업무 관련 데이터 표준 변경 제안에 대한 합동 검토, 데이터 모델에 대한 데이터 표준 적용 및 준수 여부 체크
- 데이터 관리자 주요 역할
- 데이터 표준화 절차
구분 | 주요 활동 |
데이터 표준화 요구 사항 수집 | * 개별 시스템 데이터 표준 수집 * 데이터 표준화 요구 사항 수집 * 표준화 현황 진단 |
데이터 표준 정의 | * 표준화 원칙 * 데이터 표준 정의 : 표준 용어, 표준 단어, 표준 도메인, 표준 코드, 기타 표준 |
데이터 표준 확정 | * 데이터 표준 검토 및 확정 * 데이터 표준 공표 |
데이터 표준 관리 | * 데이터 표준 이행 * 데이터 표준 관리 절차 수립 : 데이터 표준 적용, 변경, 준수 검사 절차 |
데이터 표준 관리 도구
데이터 표준 관리 도구는 수립된 전사 데이터 표준 정보의 관리, 데이터 표준에 의한 개발 및 유지 보수 지원, 데이터 표준 준수 및 변경 영향도 평가를 담당하는 기능으로 구성된다. 최근에는 이러한 데이터 표준 관리 기능과 더불어 애플리케이션 정보, 데이터 흐름 정보, 각종 데이터에 대한 메타 정보에 대한 조회 기능을 갖는 시스템을 도입하여 활용하고 있다.
- 확장된 데이터 표준 관리 도구의 기능
데이터 모델 관리 | 데이터 표준 관리 도구를 이요하여 개념, 개괄, 논리, 물리모델에 대한 조회 및 변경 관리를 하는 기능 |
데이터 표준 관리 | 표준 단어, 표준 도메인 등의 표준 관련 사전을 관리하는 기능 |
데이터 품질 관리 | 데이터 품질 진단 및 분석과 비즈니스 규칙 등을 관리하는 기능 |
OLAP 정보 관리 | OLAP 시스템에 구현된 메타 정보와 연계하여 관리하는 기능 |
사용자 권한 관리 | 현업 및 IT 사용자에 대한 권한 관리 기능 |
변경 영향도 분석 | 표준 및 모델 변경에 따른 전체 영향도를 분석하는 기능 |
ETL 정보 관리 | 계정계부터 최종 사용자까지 데이터 흐름 및 매핑 정보에 대한 관리 기능 |
표준 요청 관리 | 표준의 신규 및 변경에 따른 절차와 승인 관리 기능 |
JOB 관리 | ETL 프로그램의 정상 및 오류 여부 등을 관리하는 기능 |
DB 스키마 관리 | 데이터 모델과 실제 DB와의 일치성 등을 관리하는 기능 |
- 데이터 표준 관리 시스템 기능
기능 | 세부 설명 | 주요 내용 |
단어 관리 | 전사 단어 사전 및 금칙어 | * 전사 관점에서의 단어 사전 관리 * 금칙어의 사전 정의 및 관리 |
용어 관리 | 용어 사전 | * 업무적으로 정의된 표준 용어에 대한 관리 * 기본 단어의 조합으로 업무 용어를 생성함 |
도메인 관리 | 도메인 사전 | * 대표 및 그룹 속성에 대한 데이터 타입, 길이, 소수점 이하 길이 등을 사전에 정의한 도메인 관리 |
표준 코드 관리 | 전사 표준 코드 | * 수집된 코드로부터 코드 통합 과정을 거쳐 전사 표준 코드를 도출한 후 관리 |
코드 변환 매핑 | * 소스 코드 값과 표준 코드와의 변환 매핑 관리 | |
멀티 표준 관리 | 멀티 표준 | * 코드, 컬럼, 테이블, 도메인 등에 대하여 멀티 표준을 관리해서 전사에 존재하는 여러 표준을 지원하고 이후 전사 표준으로 통합되도록 함 |
- 데이터 구조 관리 기능
기능 | 세부 설명 | 주요 내용 |
ER 모델 구조 관리 | 모델, 테이블의 구조 정보 | * ER 모델 관리 * 리포지터리부터 데이터 구조 정보 추출 및 로드 |
DB 스키마 관리 | 다양한 DBMS 지원 및 DB 스키마 로드 | * 다양한 DBMS로부터 DB 카탈로그 추출 및 로드 |
가변 속성 관리 | 모델의 사용자 속성을 자동 생성 | * 모델 기본 속성 외에 설계 속성을 쉽게 추가 |
이력 관리 | 이력 관리 | * 데이터 모델 변경 이력 * 형상 관리 지원 |
모델 비교 관리 | 충실도 및 준수도 검사 | * 데이터 구조 정보에서 표준화 자동 검사 * 표준에 대한 준수도 자동 검사 * 데이터 구조 정보 간 비교 |
- 프로세스 관리 기능 : 표준 등록, 모델 등록
'DA > 데이터아키텍처전문가(DAP)' 카테고리의 다른 글
데이터 거버넌스 (1) - 개요 (0) | 2022.04.09 |
---|---|
[DAP] - 전사아키텍처와 데이터아키텍처 (1) - 아키텍쳐 개요 (0) | 2022.04.02 |