목록전체 글 (179)
여정의 기록
원형 채널 : 원형의 외양을 조정하는 여러가지 방법 크기 채널 magnitude channel : 양적인 정보 전달 아이덴티티 채널 identity channel : 범주형 정보 전달 가장 중요한 특성을 가장 효과적인 채널로 표현할 것 여러 개의 채널 조합시 서로 방해하는 효과가 나타날 수도 있음! ( 예를 들어 산점도에서 점의 모양을 다르게 하고 + 점의 크기로 채널을 표현하는 경우 ) 선의 길이 - 위치채널 : 작은 차이도 쉽게 구별이 가능하다. 무한대로 구별 가능. 선의 굵기 - 크기채널 : 3 ~4개 종류의 굵기 까지만 구별 가능. 색, 모양 채널 : 일정 범위 이상이 되면 파악하기 힘들다 (인간이) 산점도 두 양적 변수 간의 상관관계, 전체적인 경향성 파악 특이점, 군집 찾기 산점도의 변형 점의..
시각화가 언제 좋으냐? 데이터가 크고 복잡한 정보, 데이터 탐색이 필요한 경우, 데이터의 세부적인 특성을 이해해야하는 경우 목적에 따른 데이터 시각화 방법이 달라진다. 전체적으로 어느 정당이 앞서고 있는지 한눈에 파악하고 싶다 : 요약 -> 지역구 별 인기 정당을 색으로 나타낸 지도 특정 정당의 지지율이 유달리 낮은 지역 찾아내기 : 발견 -> 지역구 별 특정 정당의 지지율을 색으로 나타낸 지도 / 막대그래프 시간에 따른 지지율 추이 파악 : 예측 -> 선그래프 어떤 데이터를 시각화할 것인가? 목적에 따른 선택! 데이터의 일부 / 변환한 데이터 / ... 를 시각화하고 싶다! - 어느 한 시점의 여론조사 결과 vs 여러 시점의 여론조사 결과 - 지역별 특정 정당의 지지율 (연속형) vs 지역별 우세 정당..

aws lambda 함수에 백엔드를 구축하고 있다. 현재 다양한 에러를 접하며 서칭해서 헤쳐나가고 있는데, 404에러에 맞닥뜨려 해결하고자 여러가지를 알아보는 중이다. 이 글은 API Gateway에 들어가보면 볼 수 있는 내용으로 Method Execution 에 대한 내용이다. 현재 나의 API Gateway를 들어가면, Integration Response 가 동작하지 않는 것을 볼 수 있다. 원인이 이것일까싶어 찾아본 결과 각 메서드를 구성하는 요소가 대략적으로 어떤 역할인지 알 수 있었다. 결론부터 얘기하자면 동작하지 않아도 된다. Integration Response는 백엔드 / lambda function 으로부터 받은 response를 클라이언트에게 전달하기전에 처리해준다. 응답을 변환하거..

기댓값 예) 기대금액 = 상금 * 확률 평균 μ(상수:변하지않는값) = E(X) 기댓값 : 확률분포의 중심을 나타낸다. 확률질량함수 점 확률 존재 예) 주사위의 눈금(X)의 기댓값은? n이 무한히 커지면 E(Y) = 연속형 확률변수에는 점 확률이 존재하지 않는다. 확률밀도함수 을 이용하면 됨 예시) E(a) = a 상수항의 기대값 = 상수항 확률밀도함수의 합은 1인 점을 이용 E(aX+b) = aE(X) + b E(aX+bY) = aE(X) + bE(Y) 확률변수의 분산과 표준편차 분산은 단위가 제곱이 되므로 단위를 맞추려면 제곱근하여 표준편차로 만들어준다. 예) 주사위를 던졌을 때 분산과 표준편차 분산의 특징 - Var(상수) = 0 - Var(aX+b) = a^2Var(X) - ∂(aX+b) = |a..

연속형 확률분포 continuous random variable 어떤 구간내의 값을 취할 수 있는 확률분포 예) 집에서 회사까지 출근에 걸리는 시간을 100일 동안 수집 - 정확한 시간이란 존재하지 않으므로 ... X = 출근 소요 시간 10

확률변수 : 확률적 실험에서 실험결과를 실수값로 대응시키는 변수 이산형, 연속형으로 구분 이산형 확률변수의 확률분포 확률질량함수 pmf : P(X=x) 누적분포함수 cdf : P(X

자기상관 시계열에 따른 의존구조가 있는 것을 자기공분산, 자기상관으로 파악한다. 자기공분산 : 서로 얼마나 선형관계가 있는가? 서로 다른 시차를 이용 자기상관함수 : 자기공분산을 표준화한 것 자기공분산함수와 자기상관함수은 시차의 순서는 상관없다. 대칭성을 가지기 때문 시점이 같으면 자기공분산함수: r(t,t) = var(Y_t) 분산이 됨 자기상관함수 : p(t,t) = 1 이 됨 (같은 변수의 관계라서) 자기상관이 없으면 자기공분산함수, 자기상관함수 모두 0이 됨. 선형관계가 없다. 양의 자기상관 자기공분산함수 r(s,t) > 0 자기상관함수 0 < p(s,t) % ggtsdisplay(main="", theme=theme_bw()) #### 그림 3-7 GDP 로그차분계열의 시계열도표, 상관도표와 부..

시계열의 주파수 분석 시계열 정보 (시간 영역 정보, 주파수 영역 정보) 푸리에 변환 : 시간 도메인을 주파수 도메인으로 변환 복잡한 함수를 sine, cosine 함수로 특성을 살펴볼 수 있다(시계열에서 어떤 변동이 우세한지). 시계열이 특정 주기로 순환 저주파 low frequency 변동 : 주파수는 작고 주기가 길다. 추세변동 고주파 high frequency 변동 : 주파수는 크고 주기가 짧다. 시계열 y_t = 주기적 함수 g(t) + 백색잡은계열 e_t FFT(Fast Fourier Transform) : 이산 퓨리에 변환(DFT)를 빠르게 계산 - DFT : O(N^2) - FFT : O(N logN) 주기도 periodogram : x축-주파수 w_j , y축-회귀자승합 시계열에 숨겨진 ..