다변량 분포 ...
이산형 결합분포
f(x,y) = 2x-4xy+2y, 0<=x<=1, 0<=y<=1
이산형 주변분포
각 경우의 수 확률을 적은 다음, 합한 값으로 X, Y 를 나눠 표시할 수 있다.
두 변수들간의 관계를 나타낸다.
공분산
두 변수를 곱한다.
분포에 따라 이산형, 연속형 확률변수의 공분산으로 나뉜다.
CoV(X,Y) = E[(X-E(X))(Y-E(Y))] = E(XY) - E(X)E(Y)
이산형 확률변수의 공분산
연속형 확률변수의 공분산
상관계수
공분산의 값은 단위가 다르면 비교가 힘들다. 그래서 표준화를 하여 진행한다.
공분산을 표준편차로 나누면 단위에 의존하지 않는 상관계수를 구할 수 있다.
-1 < = p <= 1
p>0 이면 양의 선형관계
p<0 이면 음의 선형관계
p=0 이면 선형관계 없음
조건부 확률 분포
Y값이 주어졌을 때, X의 확률분포 , 이산형
Y값이 주어졌을 때, X의 확률분포 , 연속형
조건부 기댓값
이변량 정규분포
두 개의 확률변수의 결합분포 구함
일때,
X의 확률분포는?
-> X,Y가 이변량 정규분포임. X는 정규분포를 따르는데, X ~ N(3,1) 을 따른다고 본다. (첫번째 것 값임)
X,Y의 상관계수는?
->
= -1/2
조건부 정규분포
회귀분석과 관련이 있다
다변량 정규분포
다항분포
이항분포를 2개 이상 확률변수의 결합분포로 확장한 분포
문제)
어떤 식물의 유전자 형태는 AA, Aa, aa로 구분. 각각의 확률, 0.25, 0.5, 0.25.
10개를 임의로 선택하였을 때, AA, Aa, aa인 수가 각각 3, 5, 2일 확률은?
문제) 이산형 확률변수 (X,Y) - 동전던지기 - 는 다음과 같은 결합분포를 가지고 있다.
X \ Y | 0 | 1 | 2 | 3 |
0 | 0.1 | 0.2 | 0.3 | 0.0 |
1 | 0.0 | 0.2 | 0.1 | 0.1 |
1. X = 1 일 확률은?
P(X=1) = 0.4
2. X=1 일 때, Y=2일 확률은?
P(Y=2 | X=1) = P(X=1 + Y=2) / P(X=1) = 0.1 / 0.4 = 1/4 = 0.25
3. X=1 일 때, Y의 조건부 기댓값은?
0 | 1 | 2 | 3 | ||
1 | 0 | 0.2 | 0.1 | 0.1 | 0.4 |
P(Y|X=1) | 0 | 0.2/0.4 | 0.1/0.4 | 0.1/0.4 |
E(Y|X=1) = 1 x 2/4 + 2 x 1/4 + 3 x 1/4 = 3/4
4. X,Y 의 공분산은?
Cov(X,Y) = E(XY) - E(X)E(Y) = 0.7 - 0.4 x 1.5 = 0.1 -> 두 변수가 같이 움직인다.
E(XY) = 1x1x0.2 + 1x2x0.1 + 1x3x0.1 = 0.7