본문 바로가기
수학의 재미/확률분포

확률공간과 조건부기댓값

by hustler78 2022. 6. 22.
728x90
반응형

 

금융공학은 미래를 예측하고, 모델링하는 이론이 자주 등장하기 때문에 확률 공간(ptobability space)을 빼놓고 얘기할 수가 없습니다. 너무나 방대한 이론이라 블로그에서 엄밀히 다루는 것은 어렵고 개념 위주로 설명을 해 볼까 합니다. 또한 금융공학 中, 파생상품의 가격을 구하는 이론에서는 마팅게일(Martingale) 성질이 쓰이게 됩니다. 

 

본 글에서 궁극적으로 마팅게일을 정의하기 위해 사전작업으로, 

  1. 확률공간
  2. filtration
  3. 조건부 기댓값(conditional expectation)

을 아주 간략하게나마 알아보겠습니다.

 


 

1. 확률공간

 확률 공간은 보통 다음과 같이 씁니다.

$$ (\Omega, \mathcal{F}, \mathbb{P}) $$

여기서

  1. $\Omega$ 는 표본 공간(sample space)
  2. $\mathcal{F}$ 는 이벤트 공간(event space)
  3. $\mathbb{P}$ 는 이벤트 각각이 발생할 확률을 나타내 주는 함수로서 값은 $0$과 $1$사이가 되겠죠.

예를 들어, 주사위 1개를 던졌을 때,

$$\Omega = \{ 1,2,3,4,5,6\},$$

$\mathcal{F}$는 $\Omega$의 부분합들이다,  예를 들어 나오는 눈이 짝수인 이벤트는 $\{2,4,6\}$, 3 이하의 눈이 나올 이벤트는 $\{1,2,3\}$ 등은 모두 $\Omega$의 부분집합이 됩니다. $\mathbb{P}$는 이벤트 각각에 확률을 대입하는 함수입니다.

 

다음에 정의할 filtration은 좀 더 복잡한 개념입니다. 쉽게 이야기해보도록 하죠.

 

2. Filtration

1에서 정의한 확률 공간 $(\Omega, \mathcal{F}, \mathbb{P})$ 의 발생 가능한 사건들 다 모아놓은 event set $\mathcal{F}$의 부분공간들이 있다고 합시다.

이 부분공간들을 $\{\mathcal{F}_i | i=0,1,2,\cdots \}$ 라 하죠. 이 부분 공간들이 

$$\mathcal{F}_0 \subset \mathcal{F}_1 \subset \cdots \subset \mathcal{F} $$

의 포함관계가 있다고 합시다. 이렇게 $i$라는 index가 커질수록 커지는 일련의 부분 공간 집합들을 filatration이라 합니다.

 

또는 information set이라고도 합니다. 어떤 step을 밟아갈수록 해당 정보량이 커지게 되는 거죠. 예를 들어,

 $\mathcal{F}_i$ 를 어떤 사람이 $i$살 때 경험했던 사건들, 지식의 모음이라 하면, 이 사람은 나이가 먹을수록 경험량과 삶의 지식 등이 증가할 것입니다. 하지만, 그렇다 하더라고 미래는 모르죠. 미래에 벌어질 일들은 역시 확률로 남아 있습니다.
$\mathcal{F}_i$를 상장일로부터 $i$날짜까지 삼성전자 주식의 움직임이라 하면, 모든 주가 움직임이 결정되며 정보량이 쌓여오게 됩니다. 하지만 당장 내일의 주가는 모르죠. 내일의 주가는 여전히 확률변수입니다. 내일이 돼서 결정되고 또 정보량이 증가하고.. 이런 식으로 반복이 되는 것입니다.

이렇게 시간이 지날수록, 쌓이는 정보들을 sequence로 표시해 놓은 것이 filtration이라고 직관적으로 이해합시다.

 

3. 조건부 기댓값(conditional expectation)

마팅게일을 정의하기 위해서는 조건부 기댓값을 우선 얘기해야 합니다.

고등학교 때 조건부 확률을 배운 적이 있었죠.  간단히 말해서 사건 $B$가 일어났다는 가정하에 사건 $A$가 일어날 확률은

$$\mathbb{P}(A|B) = \frac{\mathbb{P}(A\cap B)}{\mathbb{P}(B)}$$

입니다. 이 확률을 이용해서 기댓값을 구하는 것입니다. 

 

예를 들어보겠습니다. 예제는 Wikipedia에서 가져왔습니다.

주사위 던지기 놀이인데요. 두 확률 변수 $A, B$를 아래와 같이 정의합니다.

 

1 2 3 4 5 6
A 0 1 0 1 0 1
B 0 1 1 0 1 0

B=1이라는 조건 하에, A의 기댓값 

기호로는, $\mathbb{E}(A|B=1)$ 이라 씁니다. B가 1이 나았다는 것은 주사위 눈이 2,3,5 셋 중 하나라는 얘기죠.

그러면 조건부 확률들은 어떻게 될까요?

$$\mathbb{P}(눈=2 |B=1) = \frac{\mathbb{P}(눈=2, B=1)}{\mathbb{P}(B=1) } = \frac16 / \frac12  = \frac13$$

입니다. 마찬가지 방법으로  $\mathbb{P}(눈=3 |B=1)= \frac13$ , $\mathbb{P}(눈=5 |B=1) = \frac13$입니다.

따라서

$$\mathbb{E}(A|B=1) = 1\cdot \frac13 + 0\cdot \frac13 + 0 \cdot \frac13 = \frac 13 $$

입니다.

이렇듯 조건부 확률은 기댓값 구하듯이 하며 되는데, 이때 사용되는 확률은 조건부 확률이죠

일반적으로 조건부 기댓값은 다음과 같이 정의합니다.

 

Discrete Version
확률 공간 $(\Omega, \mathcal{F}, \mathbb{P})$에서  사건 $A\in\mathcal{F}$에 대해, $A$를 조건으로 하는 $X$의 기댓값은
$$ \mathbb{E}(X|A) = \sum_{x} \mathbb{P}(X=x|A) = \sum_{x} x \frac{\mathbb{P}(\{X=x\}\cap A)}{\mathbb{P}(A)}$$

더욱더 일반적인 정의는 지정된 사건 $A$가 아닌 event set $\mathcal{F}$의 부분 공간 $\mathcal{H}$에 대해서 정의하는 것입니다.

 

 일반적인 정의
확률 공간 $(\Omega, \mathcal{F}, \mathbb{P})$에서  $\mathcal{F}$의 부분 공간 $\mathcal{H}$에 대해,

$X$의 $\mathcal{H}$에 대한 조건부 기댓값 $Y$는 확률변수로서, 모든 $H\in\mathcal{H}$에 대해
$$ \int_H Y d\mathbb{P} = \int_H X \mathbb{P}$$
를 만족하는 $Y$이다. $Y$를 기호로
$$ Y = \mathbb{E}(X|\mathcal{H})$$
이라 쓴다.

위의 정의에서 확률변수 $X$는  $\mathcal{F}$에 속하는 모든 사건에 대해서 정의가 되어 있습니다. 이것을 $X$는 $\mathcal{F}$-measurable 이라는 어려운 용어를 쓰는데요. $X$를 $\mathcal{H}$안의 사건들로 제한시키면 $X$는 $\mathcal{H}$-measurable이 됩니다. 

 

조건부 기댓값은 다음의 아주 중요한 특징이 있습니다. 

 

● $X$가 $\mathcal{H}$와 독립이면, $\mathbb{E}(X|\mathcal{H}) = \mathbb{E}(X)$ 

   $X$ 로 만들어진 사건과, $\mathcal{H}$ 안에 속한 사건들끼리 서로 독립인 경우로 이해하면 됩니다.

 

● $X$가 $\mathcal{H}$-meaurable 이면, $\mathbb{E}(X|\mathcal{H}) = X$ 

 

● $X$가 $\mathcal{H}$-meaurable 이면, $\mathbb{E}(XY|\mathcal{H}) = X\mathbb{E}(Y|\mathcal{H})$

  즉, $X$는 이미 $\mathcal{H}$로 조건이 전제된 세상에서 정의된 확률변수여서, 마치 확률변수가 아닌 변수처럼 간주가 됩니다. 즉 실수 곱셈처럼 $\mathbb{E}(\cdot)$안을  넘나들수 있습니다.

 

$\mathbb{E}(\mathbb{E}(X|\mathcal{H})) =\mathbb{E}(X)$

  $X$와 $\mathbb{E}(X|\mathcal{H})$의 기댓값은 똑같습니다.

 

$\mathcal{H_1}\subset \mathcal{H_2}$ 일 때, 
$$\mathbb{E}(\mathbb{E}(X|\mathcal{H_2}) | \mathcal{H_1}) =\mathbb{E}(X|\mathcal{H_1})$$ 

  두 개의 조건 $\mathcal{H_1}$과 $\mathcal{H_2}$가 걸려있는 경우에는 조건이 더 작은 공간($\mathcal{H_1}$)에 영향을 받습니다.

 

수학적 정의를 나열하니 좀 어려워졌습니다. 조건부 기댓값이란,  확률공간 전체에서 구한 기대값이 아닌

"full 정보($\mathcal{F}$) 중  특정 정보($\mathcal{H}$)가 주어진 조건하에서 기댓값"

으로 쉽게 이해할 수 있습니다.

 

"우산을 쓴 사람을 볼 확률"과 "비 오는 날 우산을 쓴 사람을 볼 확률" 이 사뭇 다르다는 것입니다.

 

비가 오긴 오는건가~

 

다음 글에서는 정보가 늘어가는 정도인 filtration과  좋은 관계를 만족하는 어떤 확률변수 집단에 대해서 알아보겠습니다.

728x90
반응형

댓글