여정의 기록

데이터의 품질과 표현 본문

공부중 .../데이터과학개론

데이터의 품질과 표현

Chelsey 2022. 10. 25. 18:03
728x90

데이터 품질은

고객중심 경영환경 구축 - 고객관계관리CRM이 제대로 성과를 거두지 못하고 실패 - 고객정보데이터의 낮은 품질

데이터를 사용하기에 적절한 환경 (적합성, 적시성, 정확성, 완전성, 적절성, 접근 가능성 등) 

좋은 품질의 데이터
업계 표준을 준수하는 완전하고 일관성 있는 정확한 데이터를 의미

데이터 품질관리 미흡의 영향
소매판매 분야 - 제품 설명 오류, 가격 책정 오류 - 판매기회 손실, 고객의 불만
유통 분야 - 취급주의 정보 및 규격정보 누락 - 물품파손, 진열/적재 문제
법/규제관련 분야 - 함유요소 누락 및 부정확한 측정 - 벌금, 제재

데이터 품질관리 시스템이 필요하다

데이터 품질관리 시스템 Data Quality Management System
- 신뢰성있는 좋은 데이터 공급하도록하는 내부 프로세스
- 데이터 품질 프레임워크 가이드 제공
- 기존의 시스템 위에 구축가능해 초기 비용이 상당히 적게 듬

데이터 관리의 효과적 실행을 위한 주안점
1. 현존 데이터 관리에 대한 진단 및 평가 -> 개선 방향 모색
2. 기업의 규모 -> 적정 데이터 관리 체계 마련
3. 데이터 품질관리 절차의 복잡성 평가 -> 향후 관리 방향의 설정

낮은 품질의 데이터의 예
- 결측치나 속성이 알려지지 않은 데이터 -> 결측치의 보완 문제 등 주의
- 부정확하고 유효성, 일관성이 없는 데이터 -> 잘못된 기록이나 정보로 활용되지 않도록 유의
- 왜곡되고 잘못된 인코딩에 의한 데이터 -> 데이터 왜곡의 이유를 파악하고 이의 처리 방법을 논의
- 잘못된 해석을 초래하는 데이터 -> 데이터 설명을 충분히 숙지
- 오염된 데이터 -> 데이터 클리닝 과정 고려
- 중요성을 간과하고 있는 지나치게 많은 양의 데이터 -> 중요성을 지니는 것 선별

데이터 표현의 방법

프레젠테이션

듣는 이에게 정보, 기획, 안건을 제시하고 설명하는 행위
내용의 명확성, 간결성, 흡인력 등을 바탕으로 체계화된 구성이 필요
시각화를 통한 정보의 전달
3P - Purpose, People, Place

데이터를 표현하는 하나의 도구

효과적인 표현도구

데이터 환경 변화
- 정보의 바탕이 되는 데이터를 어떻게 이용하여 의사결정에 도움이 되는 프레젠테이션을 하느냐가 매우 중요한 문제로 부각
- 원시데이터에서 중요한 정보를 추출하여 지식화하는 과정이 중시

데이터 시각화와 데이터 마이닝
데이터가 지식으로 바뀌는 과정에서 중요한 역할

데이터 시각화
- 도식적인 형태 안에 나타내고자 하는 바를 추상적 혹은 정량적으로 표현
- 그래픽을 이용해 명확하고 효과적으로 정보를 전달하고 교감하는 목적

인포그래픽
복잡한 데이터, 정보, 지식을 빠르고 명확하게 이해할 수 있도록 제작
- 시각화와는 달리 원 데이터를 드러내지 않고 실용적으로 단순화

데이터 마이닝
데이터의 특징을 뽑아낸 것, 다량의 가공하지 않은 데이터로부터 소량의 귀중하고 유용한 정보 혹은 지식을 추출하는 과정

시각화만으로 아무리 뛰어나다해도 탁월한 통찰력을 얻을 수 있는 것은 아니라는 것 유의

 

728x90