여정의 기록
시각화 종류 본문
728x90
- 원형
- 채널 : 원형의 외양을 조정하는 여러가지 방법
- 크기 채널 magnitude channel : 양적인 정보 전달
- 아이덴티티 채널 identity channel : 범주형 정보 전달
- 가장 중요한 특성을 가장 효과적인 채널로 표현할 것
- 여러 개의 채널 조합시 서로 방해하는 효과가 나타날 수도 있음!
- ( 예를 들어 산점도에서 점의 모양을 다르게 하고 + 점의 크기로 채널을 표현하는 경우 )
- 선의 길이 - 위치채널 : 작은 차이도 쉽게 구별이 가능하다. 무한대로 구별 가능.
- 선의 굵기 - 크기채널 : 3 ~4개 종류의 굵기 까지만 구별 가능.
- 색, 모양 채널 : 일정 범위 이상이 되면 파악하기 힘들다 (인간이)
- 산점도
- 두 양적 변수 간의 상관관계, 전체적인 경향성 파악
- 특이점, 군집 찾기
- 산점도의 변형
- 점의 색, 모양, 크기 채널(버블 차트)로 추가적인 정보 시각화
- 산점도 위에 회귀직선 그릴수도
- 흩뜨려진 산점도 : 점이 겹쳐져서 표현이 어려우면 점의 가로위치와 세로 위치에 작은 난수를 더해서 그려보자
- 막대그래프
- 변환된 데이터 기준, 식별자 별로 양적 특성 표현
- 두 종류가 있음
- 하나의 범주형 변수 - 하나의 양적 변수 관계 그래프
- 하나의 범주형 변수의 분포 그래프
- 누적 막대그래프
- 두 개 범주형 변수의 분포 표현
- 하나는 가로위치로 표현, 하나는 막대 안에서 색으로 구분, 도수는 막대의 길이로 표현
- 히스토그램
- 하나의 양적 변수의 분포 표현
- x축 구간 정하는 방법 : 상황과 목적에 알맞게
- 선그래프
- 시계열 데이터 시각화
- 양적 특성의 값이 다른 양적 특성(시간...)의 값이 증가함에 따라 어떻게 변하는지
- 원그래프
- 하나의 범주형 변수의 분포 표현
- 각 범주 비율의 합이 100%가 되어야 하는 데이터 표현에 적합하다
- 비교, 경향성 파악이 용이하지 않다 (막대그래프가 더 좋다)
- Trellis 그래프
- 중첩
- 제외
- 나타내려는 데이터의 일부분을 제외하고 나머지만 시각화
- 합치기
- 고차원 데이터
- 주성분 분석 PCA
- 3차원 시각화는 되도록이면 피한다.
- 색의 차이가 흑백으로도 충분하게
- 웨버의 법칙 Weber's law
- 인간이 변화하는 자극을 인식할 때, 상대적으로 인식하는게 크기 때문에 범주의 조절로 비교시 작은 차이를 큰 차이로 인식할 수 있다.
728x90
'공부중 ...' 카테고리의 다른 글
표본분포 알아내는 방법 (약대수의 법칙, t분포) (0) | 2023.06.04 |
---|---|
다변량 분포 ... (0) | 2023.06.04 |
데이터를 시각화하는 것이란 ... (0) | 2023.05.29 |
기댓값과 분산을 알아보자 (0) | 2023.05.17 |
연속형 확률분포 continuous random variable 균등분포, 정규분포 (1) | 2023.04.25 |