DA/데이터아키텍처전문가(DAP)

데이터 표준화

devYongs 2022. 4. 10. 16:46

데이터 표준화의 정의

데이터 표준화 : 시스템별로 산재해 있는 데이터 정보 요소에 대한 명칭, 정의, 형식, 규칙에 대한 원칙을 수립하여 이를 전사적으로 적용하는 것

  1. 데이터 명칭
    • 유일성 : 하나의 개념에 대해 모든 사용자가 통일된 용어를 사용할 수 있도록 하나의 명칭만을 허용 (ex : email, email 주소 -> email 주소로 통일)
    • 업무적 관점의 보편성 : 데이터 명칭은 업무적 관점에서 보편적으로 인지되는 이름이어야 한다. 조직 구성원들이 해당 개념을 지칭할때 가장 많이 사용하는 업무 용어를 그대로 사용하는 것이 바람직하다
    • 의미 전달의 충분성 : 데이터 명칭은 이름만으로 데이터의 의미 및 범위가 파악될 수 있어야 한다. 업무나 사용자의 관점에 따라 의미가 달라질 수 있는 이름은 수식어 등을 사용함으로써 구체화하는 것이 좋다.
  2. 데이터 정의 : 데이터 정의는 해당 데이터가 의미하는 범위 및 자격 요건을 규정하는 것
    • 업무 관점에서 범위와 자격 요건을 명시, 데이터 명칭만으로는 사용자에게 전달하기 어려운 기타 사항들을 전달하는 역할을 하고, 데이터 소유자를 결정하는 기준이 된다.
    • 데이터 사용자가 데이터의 의미를 잘 이해할 수 있도록 관련 업무를 모르는 제 3자의 입장에서 기술한다.
    • 서술식 정의만으로 데이터의 의미 전달이 어려울 경우에 실제 발생할 수 있는 데이터의 값도 같이 기술한다.
    • 데이터 명칭을 그대로 서술하거나 약어 또는 전문 용어를 이용한 정의 기술은 가급적 사용하지 않는다.
  3. 데이터 형식 : 표현 형태의 정의를 통해 데이터 입력 오류와 통제 위험을 최소화하는 역할을 한다.
    • 데이터 타입(Numeric, Text, Date 등)
    • 데이터 길이 및 소수점 자리
    • 도메인을 정의하여 데이터 표준에 적용함으로써 성격이 유사한 데이터 간의 데이터 형식을 통일한다.
    • 데이터의 최댓값 또는 최대 길이가 고정되어 있지 않을 경우 충분히 여유 있게 정의한다.
    • 특수 데이터 타입(CLOB, Long Raw 등)은 데이터 조회, 백업, 이행 등에 있어서 제약 사항이 존재하는 경우가 많기 때문에 가급적 사용하지 않는다.
  4. 데이터 규칙 : 데이터 규칙은 발생 가능한 데이터 값을 사전에 정의함으로써 데이터의 입력 오류와 통제 위험을 최소화하는 역할을 한다. 정합성 및 완전성을 향상할 수 있다.
    • 기본 값 : 데이터 값의 입력을 생략했을 경우 자동으로 입력되는 데이터 값
    • 허용 값 : 업무 규칙과 일관성을 갖도록 입력이 가능한 데이터 값을 제한
    • 허용 범위 : 업무 규칙과 일관성을 갖도록 입력이 가능한 데이터 값을 범위로 제한함

 

데이터 표준화 구성요소

데이터 표준화 구성요소 : 전사적인 데이터 표준화를 추진하기 위해 수집해야 할 표준화 구성요소는 데이터 표준, 데이터 표준관리 조직, 데이터 표준화 절차이다.

  1. 데이터 표준
    데이터 표준화는 기본적으로 모든 객체를 대상으로 수행하는 것이 이상적이지만, 주로 관리해야 될 필요성이 있는 객체만을 대상으로 데이터 표준화하는 것이 효율적이다. 그 대상에는 용어, 단어, 도메인, 코드가 있다
    • 표준 용어 : 업무적으로 사용하는 용어에 대한 표준을 정의함으로써 용어 사용 및 적용에 대한 혼란을 방지하고 원활한 커뮤니케이션을 촉진한다. 표준 용어는 업무적 용어와 기술적 용어가 있다.
    • 표준 단어 : 표준 용어를 구성하는 단어에 대한 표준을 정의함으로써 용어에 대한 한글명과 영문명을 일관되게 정의할 수 있게 한다.
      * 표준 단어를 관리함으로써 동일한 개념을 의미하는 용어의 생성을 예방한다.
      * 표준 용어는 영문명 작성 기준이 된다 -> 테이블 및 컬럼의 한글명만 작성하면 영문명은 표준 단어에 의해 자동으로 결정된다.
    • 표준 도메인 : 컬럼에 대한 성질을 그룹핑한 개념이다. 도메인은 크게는 문자형/숫자형/일자형/시간형, 세부적으로는 명/주소/ID , 금액/율/수량 등으로 분류할 수 있다.
    • 표준 코드 : 도메인의 한 유형으로, 특정 도메인 값이 이미 정의되어 있는 도메인이다. 코드에 대한 표준은 다른 값과는 달리 코드 값까지 미리 정의해야 한다.
    • 기타 데이터 표준 관련 요소 : 데이터 모델에서 정의하는 주제 영역, 관계명, 데이터베이스, 데이터베이스 스키마, 테이블, TABLESPACE, INDEX, CONSTRAINT 등에 대한 표준을 관리한다.
  2. 데이터 표준 관리 조직 : 전사적으로 수립된 데이터 표준 원칙, 데이터 표준, 데이터 표준 준수 여부 관리 등을 위해서는 DA의 역할이 요구된다.
    • 데이터 관리자 주요 역할
      • 데이터에 대한 정책과 표준 정의 : 데이터에 대한 표준화 원칙 및 표준을 정의한다. 표준에 대한 변경과 추가 발생 시에 최종적으로 승인 의사결정을 수행하며, 기업 내에 산재된 시스템에 대한 데이터 표준 준수 여부를 주기적으로 체크하여 지속적인 표준 관리 활동을 수행한다.
      • 부서 간 데이터 구조 조율 : 데이터 관리자는 전사 데이터 관리 기준에 의거하여 단위 시스템이나 조직 부처에 명확한 데이터 관리 기준을 제시하고, 부서 간 데이터 구조에 대한 이견 발생 시에 전사 데이터 관리 관점에서 데이터 구조를 제시하여 체계적인 데이터 구조 관리가 이루어지는 역할을 수행한다.
      • 데이터 보안 관리 : 데이터에 대한 보안 정책 수립, 보안 정책 준수 여부 체크, 보안 시정 조치 요구 등을 수행한다.
      • 데이터 모델 관리 : 데이터에 대한 중요한 의사소통의 도구가 되는 데이터 모델을 물리적인 변경 시점에 동일하게 관리함으로써 향후 데이터 활용에 대한 업무 협의 시 신속한 의사결정이 이루어지도록 관리한다.
      • 데이터의 효율적인 활용 방안 계획 : 데이터가 전사적으로 공유되어 효율적으로 활용되도록 지속적으로 데이터 활용상의 문제점 등을 체크하여 데이터 활용과 관련된 방안을 수립하여 시행한다.
    • 데이터 관리자 세부 역할
      • 전사 데이터 관리자 : 데이터 표준화에 대한 정책 결정, 검토한 데이터 표준 제안에 대한 승인
      • 업무 데이터 관리자 : 담당 업무 기능의 데이터 요구 사항 반영을 위해 필요한 데이터 표준 정의, 업무 관련 데이터 표준 변경 제안에 대한 합동 검토
      • 업무 시스템 데이터 관리자 : 시스템 관리 목적의 데이터 요구 사항을 위해 필요한 데이터 표준 정의, 업무 관련 데이터 표준 변경 제안에 대한 합동 검토, 데이터 모델에 대한 데이터 표준 적용 및 준수 여부 체크
  3. 데이터 표준화 절차
구분 주요 활동
데이터 표준화 요구 사항 수집 * 개별 시스템 데이터 표준 수집
* 데이터 표준화 요구 사항 수집
* 표준화 현황 진단
데이터 표준 정의 * 표준화 원칙
* 데이터 표준 정의 : 표준 용어, 표준 단어, 표준 도메인, 표준 코드, 기타 표준
데이터 표준 확정 * 데이터 표준 검토 및 확정
* 데이터 표준 공표
데이터 표준 관리 * 데이터 표준 이행
* 데이터 표준 관리 절차 수립 : 데이터 표준 적용, 변경, 준수 검사 절차

 

데이터 표준 관리 도구

데이터 표준 관리 도구는 수립된 전사 데이터 표준 정보의 관리, 데이터 표준에 의한 개발 및 유지 보수 지원, 데이터 표준 준수 및 변경 영향도 평가를 담당하는 기능으로 구성된다. 최근에는 이러한 데이터 표준 관리 기능과 더불어 애플리케이션 정보, 데이터 흐름 정보, 각종 데이터에 대한 메타 정보에 대한 조회 기능을 갖는 시스템을 도입하여 활용하고 있다.

  • 확장된 데이터 표준 관리 도구의 기능
데이터 모델 관리 데이터 표준 관리 도구를 이요하여 개념, 개괄, 논리, 물리모델에 대한 조회 및 변경 관리를 하는 기능
데이터 표준 관리 표준 단어, 표준 도메인 등의 표준 관련 사전을 관리하는 기능
데이터 품질 관리 데이터 품질 진단 및 분석과 비즈니스 규칙 등을 관리하는 기능
OLAP 정보 관리 OLAP 시스템에 구현된 메타 정보와 연계하여 관리하는 기능
사용자 권한 관리 현업 및 IT 사용자에 대한 권한 관리 기능
변경 영향도 분석 표준 및 모델 변경에 따른 전체 영향도를 분석하는 기능
ETL 정보 관리 계정계부터 최종 사용자까지 데이터 흐름 및 매핑 정보에 대한 관리 기능
표준 요청 관리 표준의 신규 및 변경에 따른 절차와 승인 관리 기능
JOB 관리 ETL 프로그램의 정상 및 오류 여부 등을 관리하는 기능
DB 스키마 관리 데이터 모델과 실제 DB와의 일치성 등을 관리하는 기능
  • 데이터 표준 관리 시스템 기능
기능 세부 설명 주요 내용
단어 관리  전사 단어 사전 및 금칙어 * 전사 관점에서의 단어 사전 관리
* 금칙어의 사전 정의 및 관리
용어 관리 용어 사전 * 업무적으로 정의된 표준 용어에 대한 관리
* 기본 단어의 조합으로 업무 용어를 생성함
도메인 관리 도메인 사전 * 대표 및 그룹 속성에 대한 데이터 타입, 길이, 소수점 이하 길이 등을 사전에 정의한 도메인 관리
표준 코드 관리 전사 표준 코드 * 수집된 코드로부터 코드 통합 과정을 거쳐 전사 표준 코드를 도출한 후 관리
코드 변환 매핑 * 소스 코드 값과 표준 코드와의 변환 매핑 관리
멀티 표준 관리 멀티 표준 * 코드, 컬럼, 테이블, 도메인 등에 대하여 멀티 표준을 관리해서 전사에 존재하는 여러 표준을 지원하고 이후 전사 표준으로 통합되도록 함
  • 데이터 구조 관리 기능
기능 세부 설명 주요 내용
ER 모델 구조 관리 모델, 테이블의 구조 정보 * ER 모델 관리
* 리포지터리부터 데이터 구조 정보 추출 및 로드
DB 스키마 관리 다양한 DBMS 지원 및 DB 스키마 로드 * 다양한 DBMS로부터 DB 카탈로그 추출 및 로드
가변 속성 관리 모델의 사용자 속성을 자동 생성 * 모델 기본 속성 외에 설계 속성을 쉽게 추가
이력 관리 이력 관리 * 데이터 모델 변경 이력
* 형상 관리 지원
모델 비교 관리 충실도 및 준수도 검사 * 데이터 구조 정보에서 표준화 자동 검사
* 표준에 대한 준수도 자동 검사
* 데이터 구조 정보 간 비교
  • 프로세스 관리 기능 : 표준 등록, 모델 등록