공부중 .../데이터과학개론

인포그래픽, 데이터 시각화 단계와 종류

Chelsey 2022. 12. 8. 16:09
728x90

데이터 시각화란 데이터의 특징을 한정된 지면, 공간내에 효과적으로 요약하여 표현하는 도구입니다.
단순히 데이터를 표현하는 것에 나아가 데이터에 내재된 경향이나 분석 결과를 한 눈에 알아보도록 시각적으로 표현합니다.
데이터 분석 방법론과 비교적 데이터를 빨리 정보화하여 빠르고 효과적으로 전달할 수 있습니다.
받는 이가 사전 지식이 충분치 않아도 쉽게 이해할 수 있습니다.

데이터를 데이터 시각화, 인포그래픽로 데이터를 표현하고 데이터 마이닝을 통해 데이터를 정보화할 수 있습니다.
만약 심미적 기능(아름답게)에 집중한다면 본래의 데이터 시각화 목적 달성에 어려울 수 있다

인포그래픽이란 무엇인가?
시각화 도구인데 원데이터의 노출이 상대적으로 덜하며 단순히 원하는 것을 표현할 수 있다
예시로 표시판이나 신문 기사가 있다.

데이터 마이닝에서 데이터 가치 선별작업을 많이 한다.
데이터 시각화를 위해 데이터 마이닝을 하거나 데이터 마이닝 과정에서 시각화를 하기도 한다.

데이터 시각화 3단계

  1. 정보 구조화 :
        데이터를 수집하고 정제하는 과정 - 체계화 구조화
  2. 정보 시각화 :
        정제된 데이터를 이용해 그래프 혹은 분석도구로 데이터를 시각화한다(분석도구의 특성에 영향을 받게 된다)
  3. 정보 시각표현(목적) :
        정보를 정확하게 표현, 전달하기 위해 그래픽 요소를 추가, 부가적 기술 등을 적용해 시각화 효과를 극대화하는 단계이다

 

데이터 시각화 기법을 분류해보면,

  • 시각 시각화
    시간의 흐름에 따른 데이터의 변화를 표현한다.
    시간 축을 포함한 막대그래프(bar), 누적막대그래프(hist), 선그래프(line)
  • 분포 시각화
    데이터가 겹치지 않는다.
    각 속성의 비중을 나타낸다.
    모두 합하면 1이 된다.
    예) 성별 비중, 인종 비중 ...
    면적을 적용하여 특정 공간을 나타내어 표현한다.
    파이차트(pie), 도넛차트, 트리맵(미국 주식), 누적연속그래프(시간 시각화 특징도 있다) 등 => 모두 합하면 1이 된다
  • 관계 시각화
    서로 다른 두 변수 이상 사이의 관계를 표현한다
    산점도(scatter) 행렬(두개 변수 관계 표현), 버블차트(세 변수 이상의 관계 표현 가능) 등
  • 비교 시각화
    데이터 전반에 걸친 변수별 특징을 전체적으로 살펴본다.
    히트맵(변수명 * 표준화한 값들), 체르노프 페이스
  • 공간 시각화
    지도에 관측치 표현 - 각 변수와 관계성을 나타낸다.
    구별 우편번호(각 구별 우편번호를 적는다)

 

728x90