Perron-Frobenius Theorem, part 1

2019-12-11
Jun Sok Huhh | ๐Ÿ lostineconomics.com

tl;dr

Definitions

positive, nonnegative

๋ฒกํ„ฐ xx, yy๊ฐ€ ์žˆ์„ ๋•Œ x>yx > y๋Š” (xโˆ’y)(x-y)๊ฐ€ ์–‘์ด๋ผ๋Š” ๋œป์ด๋‹ค. ์•ž์œผ๋กœ ๋ฒกํ„ฐ์™€ ํ–‰๋ ฌ์— ๋Œ€ํ•ด์„œ >> ๊ทธ๋ฆฌ๊ณ  โ‰ฅ\geq๋Š” ๋ชจ๋‘ ์›์†Œ-๋‹จ์œ„(element-wise)๋ฅผ ๋œปํ•œ๋‹ค.

Basic facts

Regular nonnegative matrices

AโˆˆRnร—nA \in \mathbb{R}^{n \times n} ๊ทธ๋ฆฌ๊ณ  Aโ‰ฅ0A \geq 0๋ฅผ ๊ฐ€์ •ํ•˜์ž.
AA๋Š” ๋‹ค์Œ์˜ ์กฐ๊ฑด์„ ๋งŒ์กฑํ•  ๋•Œ ์ •์น˜ ํ–‰๋ ฌ(regular matrix)์ด๋ผ๊ณ  ํ•œ๋‹ค. 1๋ณด๋‹ค ํฐ ์ •์ˆ˜ kk์— ๋Œ€ํ•ด์„œ Ak>0A^k > 0๋ฅผ ๋งŒ์กฑํ•œ๋‹ค.

For graph matrices

๋…ธ๋“œ๋“ค ๊ฐ„์˜ ๊ทธ๋ž˜ํ”„ ๊ด€๊ณ„๋ฅผ ๊ฐ€์žฅ ์‰ฝ๊ฒŒ ๋‚˜ํƒ€๋‚ผ ์ˆ˜ ์žˆ๋Š” ๊ฒƒ์ด ํ–‰๋ ฌ์ด๋‹ค. ์ฆ‰, i,jโˆˆ{1,2,โ€ฆ,n}i, j \in \{ 1, 2, \dotsc, n \} ์ผ ๋•Œ, Aij>0A_{ij}>0์ด๋ฉด iโ†’ji \to j์˜ ์—ฃ์ง€๋ฅผ ๊ทธ๋ฆด ์ˆ˜ ์žˆ์Œ์„ ๋‚˜ํƒ€๋‚ธ๋‹ค. ์ด๋•Œ (Ak)ij>0(A^k)_{ij} > 0์™€ ๋™์น˜๋Š” jโ†’ij \to i ๋กœ ์—ฐ๊ฒฐ๋˜๋Š” ๊ธธ์ด kk์˜ ๊ฒฝ๋กœ๊ฐ€ ์กด์žฌํ•จ์„ ์˜๋ฏธํ•œ๋‹ค.

์ด๋•Œ AA๊ฐ€ ์ •์น™ ํ–‰๋ ฌ์ด ์˜๋ฏธ๋Š” ๋ฌด์—‡์ผ๊นŒ? ์ด๋Š” ๋ชจ๋“  ๋…ธ๋“œ์—์„œ ๋‹ค๋ฅธ ์–ด๋–ค ๋…ธ๋“œ๋กœ ์ด๋™ํ•˜๋Š” ์ž„์˜์˜ kk ๊ธธ์ด์˜ ๊ฒฝ๋กœ๊ฐ€ ํ•ญ์ƒ ์กด์žฌํ•œ๋‹ค๋Š” ๋œป์ด๋‹ค.

Examples

Not regular

[1101]\begin{bmatrix} 1& 1 \\0& 1 \end{bmatrix}
[0110]\begin{bmatrix} 0& 1 \\1& 0 \end{bmatrix}

Regular

[110001100]\begin{bmatrix} 1& 1& 0 \\0& 0& 1\\ 1&0&0 \end{bmatrix}

์ฐจ์ด๋ฅผ ์•Œ๊ฒ ๋Š”๊ฐ€? AA๊ฐ€ ๋ ˆ๊ทค๋Ÿฌ ํ–‰๋ ฌ์ด๋ผ๋ฉด Aโ‰ฅ0A \geq 0์ด๋”๋ผ๋„ Ak>0A^k > 0๊ฐ€ ๋œ๋‹ค.

Perron-Frobenius theorem

์ฆ๋ช…์€ ์ผ๋‹จ ์ƒ๋žตํ•˜์ž. ๊ทธ๋ฆฌ ์–ด๋ ต์ง€ ์•Š์ง€๋งŒ ํŽ˜๋ก -ํ”„๋กœ๋ฒ ๋‹ˆ์šฐ์Šค ์ •๋ฆฌ ๋‚ด์šฉ์ด ์ค‘์š”ํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์ด์— ์ง‘์ค‘ํ•˜๊ฒ ๋‹ค.

For regular matrices

Aโ‰ฅ0A \geq 0์ด๊ณ  AA๊ฐ€ ๋ ˆ๊ทค๋Ÿฌ ํ–‰๋ ฌ์ด๋ฉด ์•„๋ž˜๋ฅผ ๋ชจ๋‘ ๋งŒ์กฑํ•œ๋‹ค.

๋ฌผ๋ก  ์•„์ด๊ฒ๋ฒกํ„ฐ๋Š” ์•„์ด๊ฒ์ŠคํŽ˜์ด์Šค์— ์†ํ•˜๋ฏ€๋กœ ๋ฒกํ„ฐ ์ „์ฒด์— ๋Œ€ํ•œ ์Šค์ผ€์ผ๋ง์ด ๊ฐ€๋Šฅํ•˜๋‹ค. ฮปpf\lambda_{\rm pf}๋Š” ํ–‰๋ ฌ AA์˜ ํŽ˜๋ก -ํ”„๋กœ๋ฒ ๋‹ˆ์šฐ์Šค์˜ ๊ทผ(ํ˜น์€ PF ์•„์ด๊ฒ๋ฐธ๋ฅ˜)๋ผ๊ณ  ๋ถ€๋ฅธ๋‹ค.

For nonnegative matrices

Aโ‰ฅ0A \geq 0.

Markov chain

ํŽ˜๋ก -ํ”„๋กœ๋ฒ ๋‹ˆ์šฐ์Šค ์ •๋ฆฌ๊ฐ€ ๊ฐ€์žฅ ์•„๋ฆ„๋‹ต๊ฒŒ ํ™œ์šฉ๋˜๋Š” ์‚ฌ๋ก€๋Š” ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ ๋ชจ๋ธ์ด๋‹ค. ํ™•๋ฅ  ๊ณผ์ •(stochastic process) X0,X1,โ€ฆ,XnX_0, X_1, \dotsc, X_n์ด ์•„๋ž˜์™€ ๊ฐ™์€ ๊ณผ์ •์„ ๋”ฐ๋ฅธ๋‹ค๊ณ  ํ•˜์ž.

Prob(Xt+1=jโˆฃXt=i)=pij {\rm Prob}(X_{t+1} = j \vert X_t =i) = p_{ij}

์ฆ‰, ์ด๋Š” iโ†’ji \to j์˜ ํ™•๋ฅ , ์ฆ‰ ii ์ƒํƒœ์—์„œ jj ์ƒํƒœ๋กœ ์˜ฎ๊ฒจ๊ฐˆ ํ™•๋ฅ ์„ ์˜๋ฏธํ•œ๋‹ค. ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ์˜ ํŠน์ง•์€ (t+1)(t+1) ๊ธฐ์˜ ์ƒํƒœ๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ๊ฒƒ์€ ์˜ค์ง tt ๊ธฐ์˜ ์ƒํƒœ๋‹ค. ์ฆ‰, tโˆ’kt-k for k=2,โ€ฆ,tk=2, \dots, t ๋Š” (t+1)(t+1)์˜ ์ƒํƒœ๋ฅผ ๊ฒฐ์ •ํ•˜๋Š” ๋ฐ ์˜ํ–ฅ์„ ์ฃผ์ง€ ์•Š๋Š”๋‹ค. PP๋Š” ์ดํ–‰ ํ–‰๋ ฌ(transition matrix) ํ˜น์€ ํ™•๋ฅ  ํ–‰๋ ฌ(stochastic matrix)๋ผ๊ณ  ๋ถ€๋ฅธ๋‹ค.

P=[p11p12โ€ฆp1np21p22โ€ฆp2nโ‹ฎโ‹ฎโ‹ฑโ‹ฎpn1pn2โ€ฆpnn] P = \begin{bmatrix} p_{11}& p_{12}& \dotsc& p_{1n} \\ p_{21}& p_{22}& \dotsc& p_{2n} \\ \vdots &\vdots&\ddots&\vdots \\ p_{n1}& p_{n2}& \dotsc& p_{nn} \end{bmatrix}

PP์˜ ๊ฐ ํ–‰์˜ ํ•ฉ์€ 1์ด ๋œ๋‹ค๋Š” ์ ์„ ์ƒˆ๊ฒจ๋‘์ž. tt ๊ธฐ์— ii ์ƒํƒœ์— ์žˆ์—ˆ๋‹ค๋ฉด, (t+1)(t+1) ๊ธฐ์—๋Š” 1,2,โ€ฆ,n1, 2, \dotsc, n ์ค‘ ์–ด๋Š ํ•˜๋‚˜๋กœ๋Š” ์ƒํƒœ๋ฅผ ๋ณ€๊ฒฝํ•ด์•ผ ํ•œ๋‹ค.

ํ–‰ ๋ฒกํ„ฐ ptโˆˆRnp_t \in \mathbb{R}^n๋ฅผ XtX_t์˜ ๋ถ„ํฌ๋ผ๊ณ  ํ•˜์ž. ์ด๋•Œ (ptT)i=Prob(Xt=i)(p_t^T)_i = {\rm Prob}(X_t = i)๋ฅผ ์˜๋ฏธํ•œ๋‹ค. ์ฆ‰, tt ๊ธฐ์— ii ์ƒํƒœ๊ฐ€ ์‹คํ˜„๋  ํ˜น์€ ์กด์žฌํ•  ํ™•๋ฅ ์ด๋‹ค. (t+1)(t+1) ๊ธฐ์˜ ํ™•๋ฅ  ๋ถ„ํฌ๋ฅผ ๋ฒกํ„ฐ๋กœ ํ‘œํ˜„ํ•˜๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. pt+1=ptPp_{t+1} = p_t P.

ํ™•๋ฅ  ํ–‰๋ ฌ๋ฅผ ํ™œ์šฉํ•ด์„œ ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ์˜ ๋ฌธ์ œ๋ฅผ ์–ด๋–ป๊ฒŒ ํ’€๊นŒ? ์ผ๋‹จ ์ ๋‹นํ•œ ํ˜•ํƒœ์˜ ํ™•๋ฅ  ํ–‰๋ ฌ PP๊ฐ€ ์žˆ๋‹ค๊ณ  ํ•˜์ž. ์ฆ‰ PP๋Š” ๋น„์Œ์ด๊ณ  Pk>0P^k > 0์ด ์„ฑ๋ฆฝํ•œ๋‹ค(PP๋Š” ๋ ˆ๊ทค๋Ÿฌ ํ–‰๋ ฌ). ์ด์ œ PP์— ํŽ˜๋ก -ํ”„๋กœ๋ฒ ๋‹ˆ์šฐ์Šค์˜ ์ •๋ฆฌ๋ฅผ ์ ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค. ์ฆ‰,

PP๋ผ๋Š” ํ™•๋ฅ  ๊ณผ์ •์— ๋Œ€ํ•ด์„œ ์•„๋ž˜์˜ ๋‘ ์‚ฌ์‹ค์„ ์ฆ๋ช…ํ•˜๋„๋ก ํ•˜์ž.

  1. ์•„์ด๊ฒ๋ฐธ๋ฅ˜ 1์ด ์กด์žฌํ•œ๋‹ค.
  2. 1์ด ๊ฐ€์žฅ ํฐ ์œ ์ผํ•œ ์•„์ด๊ฒ๋ฐธ๋ฅ˜, ์ฆ‰ ฮปpf=1\lambda_{\rm pf} = 1.

์ด๊ฒƒ์ด ์ฆ๋ช…๋˜๋ฉด ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ์˜ ๊ทนํ•œ ๋ถ„ํฌ๋ฅผ ์ฐพ๋Š”๋ฐ, ํŽ˜๋ก -ํ”„๋กœ๋ฒ ๋‹ˆ์šฐ์Šค์˜ ์ •๋ฆฌ๋ฅผ ํ™œ์šฉํ•  ์ˆ˜ ์žˆ๋‹ค.

Eigenvalue 1 exists!

1์˜ ์•„์ด๊ฒ๋ฐธ๋ฅ˜๊ฐ€ ์กด์žฌํ•œ๋‹ค. ์–ด๋–ป๊ฒŒ ์•Œ ์ˆ˜ ์žˆ์„๊นŒ?

P1n=(1)1n P {\bm 1}_n = (1){\bm 1}_n

ํ™•๋ฅ  ํ–‰๋ ฌ PP์— ๋Œ€ํ•ด์„œ ๋ชจ๋“  ์›์†Œ๊ฐ€ 1์ธ nn ์ฐจ์›์˜ ์—ด ๋ฒกํ„ฐ 1n{\bm 1}_n์— ๊ด€ํ•ด์„œ ์œ„์˜ ์‹์ด ๋‹น์—ฐํžˆ ์„ฑ๋ฆฝํ•œ๋‹ค. ์ฆ‰, ํ™•๋ฅ  ํ–‰๋ ฌ PP์˜ ์šฐ ์•„์ด๊ฒ๋ฒกํ„ฐ๋Š” 1n{\bm 1}_n์ด๊ณ  ๊ทธ๋•Œ์˜ ์•„์ด๊ฒ๋ฐธ๋ฅ˜๋Š” 11์ด๋‹ค. ๊ทธ๋Ÿฌ๋ฉด ์•„์ด๊ฒ๋ฐธ๋ฅ˜ 1์— ํ•ด๋‹นํ•˜๋Š” ์ขŒ ์•„์ด๊ฒ๋ฒกํ„ฐ ฯ€\pi ๊ฐ€ ์กด์žฌํ•œ๋‹ค๊ณ  ํ•˜์ž. ์ด๋ฅผ ์ ์œผ๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

ฯ€P=ฯ€(1) \pi P = \pi (1)

์•ž์„œ ํŽ˜๋ก -ํ”„๋กœ๋ฒ ๋‹ˆ์šฐ์Šค์˜ ์ •๋ฆฌ์— ๋”ฐ๋ผ์„œ ์•„์ด๊ฒ๋ฐธ๋ฅ˜ 1์— ํ•ด๋‹นํ•˜๋Š” ์œ ์ผํ•œ ์ขŒ ์•„์ด๊ฒ๋ฒกํ„ฐ ฯ€\pi๊ฐ€ ์กด์žฌํ•œ๋‹ค. ์ด ์ขŒ ์•„์ด๊ฒ๋ฒกํ„ฐ๋Š” ๋‹น์—ฐํžˆ ์•„์ด๊ฒ๋ฒกํ„ฐ์˜ ํŠน์„ฑ์„ ์ง€๋‹ˆ๊ณ  ์žˆ๋‹ค. ์ฆ‰, ์–ด๋–ค ์ƒํƒœ ฯ€\pi์—์„œ ํ•œ๋ฒˆ์˜ ํ™•๋ฅ  ๊ณผ์ •์„ ๊ฑฐ์น˜๋”๋ผ๋„ ์—ฌ์ „ํžˆ ๊ทธ ์ƒํƒœ์— ๋จธ๋ฌผ๋Ÿฌ ์žˆ๊ฒŒ ๋œ๋‹ค.

1 is the largest eigenvalue!

ํŽ˜๋ก -ํ”„๋กœ๋ฒ ๋‹ˆ์šฐ์Šค์˜ ์ •๋ฆฌ์— ๋”ฐ๋ผ์„œ ์•„์ด๊ฒ๋ฐธ๋ฅ˜ 1์ด ๊ฐ€์žฅ ํฐ ์•„์ด๊ฒ๋ฐธ๋ฅ˜๋ผ๋ฉด, ์ด์— ์ƒ์‘ํ•˜๋Š” ์•„์ด๊ฒ๋ฒกํ„ฐ ฯ€\pi๋Š” ์–‘์ด๋ฉฐ ์œ ์ผํ•˜๋‹ค. ฯ€\pi๋Š” ์Šค์ผ€์ผ๋ง์ด ๊ฐ€๋Šฅํ•˜๊ธฐ ๋•Œ๋ฌธ์— ์Šค์ผ€์ผ๋ง์„ ๊ฑฐ์น˜๋ฉด PP์— ์˜ํ•ด ํ‘œํ˜„๋˜๋Š” ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ ํ™•๋ฅ  ๊ณผ์ •์˜ ๋ฌดํ•œ ๋ฐ˜๋ณต, ์ฆ‰ PโˆžP^\infty๊ฐ€ ์ˆ˜๋ ดํ•˜๋Š” ์œ ์ผํ•œ ๋ถ„ํฌ๊ฐ€ ๋œ๋‹ค. ์–ด๋–ป๊ฒŒ ์ฆ๋ช…ํ• ๊นŒ? ์ƒ๊ฐ๋ณด๋‹ค ์‰ฝ๋‹ค.

Proof

๋งŒ์ผ 1 ์ด์™ธ์˜ ์•„์ด๊ฒ๋ฐธ๋ฅ˜ ฮปโ€ฒ>1\lambda' > 1๊ฐ€ ์กด์žฌํ•œ๋‹ค๊ณ  ํ•˜์ž. ์ด์ œ ์–ด๋–ค ์—ด ๋ฒกํ„ฐ xx์— ์†ํ•˜๋Š” ์ตœ๋Œ€๊ฐ’์„ xmaxโกx_{\max}๋ผ๊ณ  ํ•˜์ž. ์ด๋•Œ PxP x์˜ ๊ฒฐ๊ณผ ์ƒ์‚ฐ๋˜๋Š” ์—ด ๋ฒกํ„ฐ์˜ ๊ฐ ์›์†Œ๋Š” xix_i for i=1,2,โ€ฆ,ni = 1, 2, \dotsc, n์˜ ์ปจ๋ฒก์Šค ๊ฒฐํ•ฉ์ด๋‹ค.1 ๋”ฐ๋ผ์„œ Px=xcPx = x^c์— ์†ํ•œ ์–ด๋–ค ์›์†Œ xicx_i^c๋„ xmaxโกx_{\max} ๋ณด๋‹ค ํด ์ˆ˜ ์—†๋‹ค. ์ฆ‰,

xicโ‰คxmaxโก x^c_i \leq x_{\max}

๊ทธ๋Ÿฐ๋ฐ Px=ฮปโ€ฒxP x = \lambda' x๊ฐ€ ์„ฑ๋ฆฝํ•˜๊ณ  ฮปโ€ฒ>1\lambda' >1์ด๊ธฐ ๋•Œ๋ฌธ์—, xmaxโกฮปโ€ฒ>xmaxโกx_{\max} \lambda' > x_{\max}๊ฐ€ ์„ฑ๋ฆฝํ•ด์•ผ ํ•œ๋‹ค. ์ฆ‰ ๋ชจ์ˆœ์ด๋‹ค. ๋”ฐ๋ผ์„œ ฮปโ‰ค1\lambda \leq 1์ด๊ณ , ฮปpf=1\lambda_{\rm pf} = 1์ด๋‹ค.

ํ™•๋ฅ  ํ–‰๋ ฌ PP, ์•„์ด๊ฒ๋ฐธ๋ฅ˜ 1์— ์ƒ์‘ํ•˜๋Š” ์ขŒ ์•„์ด๊ฒ๋ฐธ๋ฅ˜ ฯ€โˆ—\pi^*๋ผ๊ณ  ํ•˜์ž. ํŽ˜๋ก -ํ”„๋กœ๋ฒ ๋‹ˆ์šฐ์Šค์˜ ์ •๋ฆฌ ํ™œ์šฉํ•˜๋ฉด ์•„๋ž˜์™€ ๊ฐ™๋‹ค.

๋ณดํ†ต ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ์„ ์„ค๋ช…ํ•  ๋•Œ ์ขŒ ์•„์ด๊ฒ๋ฐธ๋ฅ˜์™€ ์šฐ ์•„์ด๊ฒ๋ฐธ๋ฅ˜๋ฅผ ๊ตฌ๋ณ„ํ•˜์ง€ ์•Š๋Š” ๊ฒฝ์šฐ๊ฐ€ ์žˆ๋‹ค. ์ด๋Š” ์—ฌ๋Ÿฌ๋ชจ๋กœ ์†ํ•ด๋‹ค. PP์˜ ์ •์˜๋ฅผ ํ™•์ธํ•˜๊ณ , ์œ„์™€ ๊ฐ™์ด ์ •์˜ํ•œ ๊ฒฝ์šฐ๋ผ๋ฉด 1์— ๋Œ€์‘ํ•˜๋Š” ์ขŒ ์•„์ด๊ฒ๋ฒกํ„ฐ๊ฐ€ ๊ทนํ•œ์ˆ˜๋ ด ๋ถ„ํฌ๊ฐ€ ๋œ๋‹ค. ๋ฐ˜๋Œ€๋กœ, ํ™•๋ฅ  ํ–‰๋ ฌ์„ PTP^T๋กœ ์ •์˜ํ–ˆ๋‹ค๋ฉด ์šฐ ์•„์ด๊ฒ๋ฒกํ„ฐ๊ฐ€ ๊ทนํ•œ ๋ถ„ํฌ๋‹ค.

Definition of limiting distribution

ํ™•๋ฅ  ๋ถ„ํฌ ฯ€=[ฯ€0,ฯ€1,ฯ€2,โ€ฆโ€‰]\pi = [\pi_0, \pi_1, \pi_2, \dotsc]๋Š” ์•„๋ž˜ ์กฐ๊ฑด์„ ๋งŒ์กฑํ•  ๋•Œ ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ PnP_n์˜ ๊ทนํ•œ ๋ถ„ํฌ๋ผ๊ณ  ๋ถ€๋ฅธ๋‹ค. ๋งŒ์ผ

ฯ€j=limโกnโ†’โˆžP(Xn=jโˆฃX0=i), โˆ€i,jโˆˆS \pi_j = \lim_{n \to \infty} P(X_n = j | X_0 = i) ,~\forall i, j \in S

์ด๊ณ 

โˆ‘jโˆˆSฯ€j=1. \sum_{j \in S} \pi_j = 1.

๋ช‡ ๊ฐ€์ง€ ์ ๋งŒ ํ™•์ธํ•ด๋ณด์ž.

limโกnโ†’โˆžPn=[ฯ€โ‹ฎฯ€] \lim_{n \to \infty} P^n = \begin{bmatrix} \pi \\ \vdots \\ \pi \end{bmatrix}

Limiting Behavior of Markov Chain

๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ์€ ์–ด๋–ป๊ฒŒ ฯ€โˆ—\pi^*๋กœ ์ˆ˜๋ ดํ•˜๊ฒŒ ๋ ๊นŒ? ํ™•๋ฅ  ํ–‰๋ ฌ PP์˜ ์•„์ด๊ฒ๋ฐธ๋ฅ˜ 1=ฮป1>ฮป2โ‰ฅโ€ฆโ‰ฅฮปn>01 = \lambda_1 > \lambda_2 \geq \dotsc \geq \lambda_n > 0, ๊ฐ๊ฐ์— ๋Œ€์‘ํ•˜๋Š” ์•„์ด๊ฒ๋ฒกํ„ฐ๋ฅผ v1,v2,โ€ฆ,vnv_1, v_2, \dotsc, v_n์ด๋ผ๊ณ  ํ•˜์ž. ์•„์ด๊ฒ๋ฒกํ„ฐ๊ฐ€ ๊ฐ๊ฐ ์„ ํ˜•๋…๋ฆฝ์ด๋ผ๊ณ  ๊ฐ€์ •ํ•˜์ž. ์ด๋•Œ ์•„์ด๊ฒ๋ฒกํ„ฐ๋กœ ๊ตฌ์„ฑ๋œ ํ–‰๋ ฌ QQ๋Š” ๊ฐ€์—ญ์ด๋‹ค. ฯ€tT=Qyt\pi^T_t = Q y_t ๋กœ ๋‚˜ํƒ€๋‚ผ ์ˆ˜ ์žˆ๋‹ค. ์ฆ‰ QQ์˜ ์„ ํ˜•๊ฒฐํ•ฉ์„ ํ†ตํ•ด nn ์ฐจ์›์˜ ์ž„์˜์˜ ๋ฒกํ„ฐ๋ฅผ ํ‘œํ˜„ํ•  ์ˆ˜ ์žˆ๋‹ค. ฯ€\pi๊ฐ€ ์—ด ๋ฒกํ„ฐ์ด๊ธฐ ๋–„๋ฌธ์— ์ด๋ฅผ ํ–‰ ๋ฒกํ„ฐ๋กœ ๋ฐ”๊ฟจ๋‹ค๋Š” ์ ์— ์œ ์˜ํ•˜์ž.2 ํ•œํŽธ,

ฯ€t+1T=PTฯ€tTQyt+1=PTQtytQโˆ’1Qyt+1=Qโˆ’1PTQtytyt+1=Dyt \begin{aligned} \pi_{t+1}^T & = P^T \pi_t^T \\ Q y_{t+1} & = P^T Q_{t} y_t \\ Q^{-1} Q y_{t+1} & = Q^{-1}P^T Q_{t} y_t \\ y_{t+1} & = D y_t \end{aligned}

๋‘ ๊ฐ€์ง€๋ฅผ ์ƒ๊ธฐํ•˜์ž.

  1. ํ–‰๋ ฌ AA์™€ ์ „์น˜ ํ–‰๋ ฌ ATA^T๋Š” ๋™์ผํ•œ ์•„์ด๊ฒ๋ฐธ๋ฅ˜๋ฅผ ์ง€๋‹ˆ๊ฒŒ ๋œ๋‹ค.3
  2. D๋Š” ์•„์ด๊ฒ๋ฐธ๋ฅ˜๋กœ ๊ตฌ์„ฑ๋œ ๋Œ€๊ฐํ–‰๋ ฌ์ด๋‹ค. ํŽธ์˜์ƒ ํฌ๊ธฐ ์ˆœ์„œ๋Œ€๋กœ ๋‚˜์—ด๋˜์–ด ์žˆ๋‹ค๊ณ  ํ•˜์ž.

์•ž์„œ ๋ณธ ๋ฐ”์— ๋”ฐ๋ผ์„œ ฮป1=1\lambda_1 =1์ด๋‹ค.

yt=[ฮป1โ€ฆ0โ‹ฎโ‹ฑโ‹ฎ0โ€ฆฮปn]ytโˆ’1. y_t = \begin{bmatrix} \lambda_1& \dotsc& 0 \\ \vdots& \ddots& \vdots \\ 0& \dotsc& \lambda_n \end{bmatrix} y_{t-1}.

์ด ์ฐจ๋ถ„๋ฐฉ์ •์‹์˜ ํ•ด๋Š” ์•„๋ž˜์™€ ๊ฐ™๋‹ค.

yt=[ฮป1โ€ฆ0โ‹ฎโ‹ฑโ‹ฎ0โ€ฆฮปn]ty0=[ฮป1tโ€ฆ0โ‹ฎโ‹ฑโ‹ฎ0โ€ฆฮปnt]y0 y_t = \begin{bmatrix} \lambda_1& \dotsc& 0 \\ \vdots& \ddots&\vdots \\ 0& \dotsc& \lambda_n \end{bmatrix}^t y_{0} = \begin{bmatrix} \lambda_1^t& \dotsc& 0 \\ \vdots& \ddots& \vdots \\ 0& \dotsc& \lambda_n^t \end{bmatrix} y_0

y0=[c1,โ€ฆ,cn]Ty_0 = [c_1, \dotsc, c_n]^T๋ผ๊ณ  ๋‘๋ฉด, yt=[c1ฮป1t,โ€ฆ,c1ฮปnt]Ty_t = [c_1 \lambda_1^t, \dotsc, c_1 \lambda_n^t]^T๊ฐ€ ๋œ๋‹ค.

ฯ€tTโ‰กQyt=c1ฮป1tv1+โ‹ฏ+c1ฮปntvn. \pi_t^T \equiv Q y_t = c_1 \lambda_1^t v_1 + \dotsb + c_1 \lambda_n^t v_n.

์ด์ œ tโ†’โˆžt \to \infty๋ฅผ ์ ์šฉํ•ด๋ณด์ž. ฮปi<ฮป1=1\lambda_i < \lambda_1 = 1 for i=2,3,โ€ฆ,ni = 2, 3, \dotsc, n์ด๋ฏ€๋กœ, ฯ€โˆžT=c1v1\pi_{\infty}^T = c_1 v_1๊ฐ€ ๋œ๋‹ค. v1v_1์ด ํ‘œ์ค€ํ™”๋œ ํ™•๋ฅ  ๋ถ„ํฌ ๋ฒกํ„ฐ์ด๋ฏ€๋กœ c1=1c_1 =1์ด์–ด์•ผ ํ•œ๋‹ค.

Appendix: Irreducibility and Aperiodicity

๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ์ด ์ˆ˜๋ ดํ•˜๋Š” ๋ถ„ํฌ๋ฅผ ๊ฐ–๊ฒŒ ๋  ์กฐ๊ฑด์œผ๋กœ ๋ณดํ†ต ๋‘ ๊ฐ€์ง€ ์กฐ๊ฑด, ๊ธฐ์•ฝ์„ฑ(irreducibility) ๊ทธ๋ฆฌ๊ณ  ๋น„์ฃผ๊ธฐ์„ฑ(aperiodicity)์ด ์ œ์‹œ๋œ๋‹ค. ๋จผ์ € ๊ฐ„๋‹จํžˆ ๋‘˜์˜ ๋‚ด์šฉ์„ ์‚ดํŽด๋ณด์ž.

Irreducible matrix

๊ธฐ์•ฝ์„ฑ์˜ ์ •์˜๋Š” ์•„๋ž˜์™€ ๊ฐ™๋‹ค.

PP๊ฐ€ ํ™•๋ฅ  ํ–‰๋ ฌ์ด๋ผ๊ณ  ํ•  ๋•Œ, ์ƒํƒœ xx, yy์— ๋Œ€ํ•ด์„œ ์–‘์˜ ์‹ค์ˆ˜ jj, kk๊ฐ€ ์กด์žฌํ•˜๋ฉด, ๋‘ ์ƒํƒœ๋Š” ์„œ๋กœ ๊ต๋ฅ˜ํ•  ์ˆ˜ ์žˆ๋‹ค๊ณ  ์นญํ•œ๋‹ค.

Pj(x,y)>0  and  Pk(y,x)>0 P^j (x, y) > 0 \text{~~and~~} P^k(y,x) > 0

์ด ์ •์˜์˜ ์˜๋ฏธ๋Š” ๋ฌด์—‡์ผ๊นŒ? ์ผ์ •ํ•œ ์ƒํƒœ๋ฅผ ๊ฑฐ์น˜๋ฉด xโ†’yx \to y ๊ทธ๋ฆฌ๊ณ  yโ†’xy \to x๋กœ ์˜ฎ๊ธฐ๋Š” ๊ฒƒ์ด ํ™•๋ฅ ์ ์œผ๋กœ ๊ฐ€๋Šฅํ•˜๋‹ค๋Š” ๋œป์ด๋‹ค. ๊ธฐ์•ฝ์„ฑ์ด๋ž€ ๋ชจ๋“  ์ƒํƒœ๊ฐ€ ๊ต๋ฅ˜ํ•  ์ˆ˜ ์žˆ๋Š” ์ƒํƒœ๋ฅผ ๋œปํ•œ๋‹ค. ๋‹ค์‹œ ๋งํ•˜๋ฉด ์–ด๋–ค ์ƒํƒœ์— ๋“ค์–ด๊ฐ€์„œ ์—ฌ๊ธฐ์„œ ๋น ์ ธ๋‚˜์˜ฌ ์ˆ˜ ์—†๋Š” ๊ฒฝ์šฐ๊ฐ€ ๋ฐœ์ƒํ•œ ๊ฐ€๋Šฅ์„ฑ์ด ์—†์„ ๋•Œ ๊ธฐ์•ฝ์„ฑ์ด ์„ฑ๋ฆฝํ•œ๋‹ค.

Irreducible

[0.90.10.00.40.40.20.10.10.8]\begin{bmatrix} 0.9& 0.1& 0.0 \\0.4& 0.4& 0.2\\ 0.1& 0.1& 0.8 \end{bmatrix}

Reducible

[1.00.00.00.10.80.10.00.20.8]\begin{bmatrix} 1.0& 0.0& 0.0 \\0.1& 0.8& 0.1\\ 0.0& 0.2& 0.8 \end{bmatrix}

Aperiodic matrix

๋Œ€์ถฉ ๋งํ•˜๋ฉด ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ ์œ„์˜ ์ด๋™์ด ์˜ˆ์ธก ๊ฐ€๋Šฅํ•œ ํ˜•ํƒœ๋กœ ์ด๋ฃจ์–ด์งˆ ์ˆ˜ ์žˆ์œผ๋ฉด ์•ˆ๋œ๋‹ค. ๋จผ์ € ์˜ˆ๋ฅผ ๋ณด๋„๋ก ํ•˜์ž.

[010001100]\begin{bmatrix} 0& 1& 0 \\0& 0& 1\\ 1& 0& 0 \end{bmatrix}

๊ฐ ์ƒํƒœ๊ฐ€ ์ผ์ •ํ•œ ๊ฐ„๊ฒฉ์œผ๋กœ ์กด์žฌํ•˜๊ฒŒ ๋œ๋‹ค. ์ฆ‰,

์ฃผ๊ธฐ์„ฑ(periodicity)์˜ ์ˆ˜ํ•™์ ์ธ ์ •์˜๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

k=gcd{n>0 โˆฃ Pr(Xn=iโˆฃX0=i)>0} k = {\rm gcd} \{ n > 0~|~{\rm Pr}(X_n = i | X_0 = i) > 0 \}

gcd๋ž€ greatest common divisor, ์ฆ‰ ์ตœ๋Œ€๊ณต์•ฝ์ˆ˜๋ฅผ ์˜๋ฏธํ•œ๋‹ค. ๋งŒ์ผ ํ•ด๋‹น ์ƒํƒœ๋กœ {6,8,12,โ€ฆโ€‰}\{ 6, 8, 12, \dotsc \} ๋ฒˆ์— ๋Œ์•„๊ฐˆ ํ™•๋ฅ ์ด ์–‘์ด๋ผ๋ฉด, gcd๋Š” 2๊ฐ€ ๋œ๋‹ค.4

์ด๋•Œ k>1k > 1์ด๋ฉด ์ฃผ๊ธฐ ํ–‰๋ ฌ์ด๊ณ  k=1k=1์ด๋ฉด ๋น„์ฃผ๊ธฐ ํ–‰๋ ฌ์ด๋‹ค. k=1k=1์˜ ์˜๋ฏธ๋Š” ๋ฌด์—‡์ผ๊นŒ? tt ๊ธฐ์— ์ƒํƒœ ss์— ์žˆ์„ ๋•Œ, t+1t+1 ๊ธฐ์— ์—ญ์‹œ ss์— ์žˆ์„ ํ™•๋ฅ ์ด ์–‘์ด๋ผ๋Š” ๋œป์ด๋‹ค. ๊ทธ๋ฆฌ๊ณ  ํ™•๋ฅ  ํ–‰๋ ฌ์„ ๊ตฌ์„ฑํ•˜๋Š” ๋ชจ๋“  ์ƒํƒœ์— ์ฃผ๊ธฐ์„ฑ์ด ์—†์„ ๋•Œ, ์ด๋Ÿฌํ•œ ํ™•๋ฅ  ํ–‰๋ ฌ์„ ๋น„์ฃผ๊ธฐ ํ–‰๋ ฌ์ด๋ผ๊ณ  ํ•œ๋‹ค.

Regular matrix vs irreducible and aperiodic matrix

ํŽ˜๋ก -ํ”„๋กœ๋ฒ ๋‹ˆ์šฐ์Šค ์ •๋ฆฌ์— ๋”ฐ๋ฅด๋ฉด ์ •์น™ ํ–‰๋ ฌ์ผ ๋•Œ ๊ทนํ•œ ๋ถ„ํฌ๊ฐ€ ์กด์žฌํ•˜๊ฒŒ ๋œ๋‹ค. ์ •์น™ ํ–‰๋ ฌ๊ณผ ๊ธฐ์•ฝ ํ–‰๋ ฌ, ๋น„์ฃผ๊ธฐ ํ–‰๋ ฌ ์‚ฌ์ด์˜ ์ˆ˜ํ•™์  ๊ด€๊ณ„๋Š” ์–ด๋–จ๊นŒ? ๊ฒฐ๋ก ๋ถ€ํ„ฐ ๋งํ•˜๋ฉด, ๋‘˜์€ ๋™์น˜๋‹ค. ์ฆ๋ช…์€ ๊ฐ„๋‹จํ•˜๋‹ค.

A โ†’\to B

Irreducible

์ •์น™ ํ–‰๋ ฌ์ด๋ฉด Pk>0P^k > 0์ด๋‹ค. Pk+1P^{k+1}์˜ ii ํ–‰ jj ์—ด์˜ ์›์†Œ๋Š” ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

pijk+1=โˆ‘t=1npitptjk>0 p_{ij}^{k+1} = \sum_{t=1}^{n} p_{it} p_{tj}^k > 0

์œ„์˜ ์‹์ด ์„ฑ๋ฆฝํ•˜๋Š” ์ด์œ ๋Š” ์ •์น™ ํ–‰๋ ฌ์˜ ๊ฒฝ์šฐ ์ ์–ด๋„ ํ•˜๋‚˜์˜ tt์— ๊ด€ํ•ด์„œ pit>0p_{it} > 0์ด ์„ฑ๋ฆฝํ•ด์•ผ ํ•œ๋‹ค. ๋งŒ์ผ ์ด๊ฒƒ์ด ์„ฑ๋ฆฝํ•˜์ง€ ์•Š์œผ๋ฉด ์ •์น™ ํ–‰๋ ฌ์ด ๋  ์ˆ˜ ์—†๋‹ค. ์ฆ‰, Pk+1>0P^{k+1} >0์ด๊ณ , Pk+2,Pk+3,โ€ฆP^{k+2}, P^{k+3}, \dotsc๋ชจ๋‘ ์–‘์ด๋‹ค.

Aperiodic

{k,k+1,k+2,โ€ฆโ€‰}\{k ,k+1, k+2, \dotsc\}์˜ gcd๋Š” 1์ด๋‹ค.

B โ†’\to A

๊ธฐ์•ฝ ํ–‰๋ ฌ์ด๋ฉด ์–ธ์ œ๋‚˜ ์ •์น™ ํ–‰๋ ฌ์ด๋‹ค.

Comments

Irreducible and aperiodic

๋งŒ์ผ ํ™•๋ฅ  ํ–‰๋ ฌ์ด ๊ธฐ์•ฝ์ด๋ฉด ์ด๋•Œ ๋น„์ฃผ๊ธฐ์„ฑ ์—ฌ๋ถ€๋ฅผ ์–ด๋–ป๊ฒŒ ํ™•์ธํ• ๊นŒ? ํ–‰๋ ฌ์ด ๊ธฐ์•ฝ ํ–‰๋ ฌ์ด๋ผ๋ฉด, ํ•ด๋‹น ํ–‰๋ ฌ์„ ๊ตฌ์„ฑํ•˜๋Š” ํ•˜๋‚˜์˜ ์ƒํƒœ๋งŒ ๋น„์ฃผ๊ธฐ์„ฑ์„ ์ง€๋‹ˆ๋ฉด ์ „์ฒด ํ–‰๋ ฌ์ด ๋น„์ฃผ๊ธฐ์„ฑ์„ ์ง€๋‹Œ๋‹ค. ์ฆ๋ช…์€ ์กฐ๊ธˆ๋งŒ ์ƒ๊ฐํ•ด๋ณด์‹œ๋ผ.

Why Aperiodicity?

๊ทนํ•œ ๋ถ„ํฌ ์กด์žฌ์— ๋น„์ฃผ๊ธฐ์„ฑ์€ ์™œ ํ•„์š”ํ• ๊นŒ? ๋งŒ์ผ ์ด ์กฐ๊ฑด์ด ์„ฑ๋ฆฝํ•˜์ง€ ์•Š์œผ๋ฉด ๊ทนํ•œ ๋ถ„ํฌ๋กœ ๊ณ„์‚ฐ๋œ ๊ฒƒ์ด ์‚ฌ์‹ค์€ ๊ทนํ•œ ๋ถ„ํฌ๋ผ๊ณ  ํ•  ์ˆ˜ ์—†๊ฒŒ ๋œ๋‹ค. ์ฆ‰,

limโกnโ†’โˆžPnโ‰ [ฯ€โ‹ฎฯ€]. \lim_{n \to \infty} P^n \neq \begin{bmatrix} \pi \\ \vdots \\ \pi \end{bmatrix}.

์˜ˆ๋ฅผ ๋“ค์–ด๋ณด์ž. ์ƒํƒœ 2๊ฐœ์ด๊ณ  ํ™•๋ฅ  ํ–‰๋ ฌ์ด ์•„๋ž˜์™€ ๊ฐ™๋‹ค๊ณ  ํ•˜์ž.

P=[0110] P = \begin{bmatrix} 0 &1 \\ 1 & 0 \end{bmatrix}
๊ทนํ•œ ๋ถ„ํฌ๋ฅผ ๊ณ„์‚ฐํ•˜๋ฉด [12,12][\dfrac{1}{2}, \dfrac{1}{2}]์ด ๋‚˜์˜จ๋‹ค. ์ƒํƒœ 1์—์„œ ์ถœ๋ฐœํ–ˆ๋‹ค๋ฉด, ์ƒํƒœ 1์ด {2,4,6}\{2, 4, 6\} ๋ฒˆ์— ๋‚˜ํƒ€๋‚˜๊ฒŒ ๋˜๊ณ , ์ด๋•Œ gcd๋Š” 2๊ฐ€ ๋œ๋‹ค. ์ด๋•Œ ํ™•๋ฅ  ํ–‰๋ ฌ์˜ ๊ณฑ์„ ์‚ดํŽด๋ณด๋ฉด ์•„๋ž˜์™€ ๊ฐ™๋‹ค. k=1,2,โ‹ฏk = 1, 2,\cdots์— ๋Œ€ํ•ด์„œ

Pn=[0110], for n=2kโˆ’1Pn=[1001], for n=2k \begin{aligned} P^n & = \begin{bmatrix} 0 & 1 \\ 1 & 0 \end{bmatrix},~\text{for}~n = 2k-1 \\ P^n & = \begin{bmatrix} 1 & 0 \\ 0 & 1 \end{bmatrix},~\text{for}~n = 2k \end{aligned}

๋”ฐ๋ผ์„œ limโกnโ†’โˆžPn\lim_{n \to \infty} P^n์€ ์ˆ˜๋ ดํ•˜์ง€ ์•Š๋Š”๋‹ค. ์•ž์„œ ๊ณ„์‚ฐํ•œ ๊ทนํ•œ ๋ถ„ํฌ๋Š” ๋‘ ๊ทน๋‹จ์˜ ํ‰๊ท ์ผ ๋ฟ์ด๋‹ค. ์ด๋•Œ ๊ทนํ•œ ๋ถ„ํฌ ์—ญ์‹œ ์กด์žฌํ•˜์ง€ ์•Š๋Š”๋‹ค.





๐Ÿ lostineconomics.com | Jun Sok Huhh


  1. pi1x1c+pi2x2c+โ‹ฏ+pinxncp_{i1} x^c_1 + p_{i2} x^c_2 + \dotsb + p_{in} x^c_n with pi1+pi2+โ€ฆ+pin=1p_{i1} + p_{i2} + \dotsc + p_{in} =1 for i=1,2,โ€ฆ,ni = 1, 2, \dotsc, n โ†ฉ๏ธŽ

  2. ์‚ฌ์‹ค ๊ธฐ์กด์˜ ฯ€\pi๊ฐ€ ์ขŒ ์•„์ด๊ฒ๋ฒกํ„ฐ์˜€๋‹ค๋ฉด ์—ฌ๊ธฐ์„œ๋Š” ์ด๋ฅผ ์šฐ ์•„์ด๊ฒ๋ฒกํ„ฐ๋กœ ๋ฐ”๊พผ ๊ฒƒ์ด๋‹ค. ๋ฌผ๋ก , ํ™•๋ฅ  ํ–‰๋ ฌ ์—ญ์‹œ PTP^T๊ฐ€ ๋˜์–ด์•ผ ํ•œ๋‹ค. โ†ฉ๏ธŽ

  3. detโก(ATโˆ’ฮปI)=detโก((Aโˆ’ฮปI)T)=detโก(Aโˆ’ฮปI)\det(A^Tโˆ’\lambda I) = \det((Aโˆ’\lambda I)^T)=\det(Aโˆ’\lambda I) โ†ฉ๏ธŽ

  4. ํ™•๋ฅ  ํ–‰๋ ฌ์˜ ์›์†Œ๊ฐ€ 0, 1๋กœ๋งŒ ๋˜์–ด ์žˆ์ง€ ์•Š์•„๋„ ์ฃผ๊ธฐ ํ–‰๋ ฌ์ด ๋  ์ˆ˜ ์žˆ๋‹ค๋Š” ์‚ฌ์‹ค์— ์œ ์˜ํ•˜์ž. โ†ฉ๏ธŽ