PageRank as Markov Chain

2019-12-24
Jun Sok Huhh | ๐Ÿ lostineconomics.com

tl;dr

PageRank as Markov Chain?

ํŽ˜์ด์ง€๋žญํฌ ์•Œ๊ณ ๋ฆฌ๋“ฌ์˜ ํ•ต์‹ฌ์ด ์‚ฌ์‹ค ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ์ด๋‹ค. ํŽ˜์ด์ง€์™€ ๋ธŒ๋ฆฐ์˜ ๋…ผ๋ฌธ์— ๋ณด๋ฉด "random surfer"๋ผ๋Š” ํ‘œํ˜„์ด ๋‚˜์˜จ๋‹ค. ์ด๊ฒŒ ๋”ฑ ํ™•๋ฅ  ๊ณผ์ •(stochastic process)์„ ์—ฐ์ƒ์‹œํ‚ค์ง€ ์•Š๋‚˜? ๋ฌธ๋“ ์ด๋Ÿฐ ์ƒ๊ฐ์ด ๋“ค๋”๋ผ.

ํŽ˜์ด์ง€์™€ ๋ธŒ๋ฆฐ์˜ ๋…ผ๋ฌธ ์ž์ฒด๊ฐ€ ๋งˆ๋ฅด์ฝ”ํ”„ ํ”„๋กœ์„ธ์Šค๋ฅผ ์—ฐ์ƒ์‹œํ‚ค์ง€๋Š” ์•Š๋Š”๋‹ค. ๋…ผ๋ฌธ์„ ๋ณด๋ฉด ํŽ˜์ด์ง€๋žญํฌ ์Šค์ฝ”์–ด๋ง์„ ์œ„ํ•œ ๋ช‡ ๊ฐ€์ง€ ์›์น™๋“ค์ด ์–ธ๊ธ‰๋˜์–ด ์žˆ์„ ๋ฟ์ด๋‹ค. ๋” ๋งŽ์€ ์•„์›ƒ๋ฐ”์šด๋“œ ๋งํฌ๋ฅผ ์ง€๋‹Œ ์›นํŽ˜์ด์ง€์— ๋‚ด ํŽ˜์ด์ง€๊ฐ€ ์—ฐ๊ฒฐ๋˜์–ด ์žˆ์„ ๋•Œ ๋‚ด ํŽ˜์ด์ง€์˜ ์Šค์ฝ”์–ด๋ฅผ ๊ณ„์‚ฐํ•  ๋•Œ ํ•ด๋‹น ํŽ˜์ด์ง€์˜ ์ค‘์š”์„ฑ์„ ๋‚ฎ์ถ˜๋‹ค. ๋งŽ์€ ์ธ๋ฐ”์šด๋“œ ๋งํฌ๋ฅผ ์ง€๋‹Œ ํŽ˜์ด์ง€์— ๋‚ด ํŽ˜์ด์ง€๊ฐ€ ์—ฐ๊ฒฐ๋˜์–ด ์žˆ๋‹ค๋ฉด ์ด ํŽ˜์ด์ง€์˜ ์ค‘์š”์„ฑ์„ ๋†’์ธ๋‹ค. ๋Œ€๋žต ์ด๋Ÿฐ ๋‚ด์šฉ๋“ค์ด๋‹ค. ์‚ฌ์‹ค ํŽ˜์ด์ง€๋žญํฌ๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ๊ณผ์ • ์ž์ฒด๋Š” ์žฌ๊ท€์ ์ธ ๋‚ด์šฉ์„ ํฌํ•จํ•˜๊ณ  ์žˆ๊ธฐ ๋•Œ๋ฌธ์— ์ง๊ด€์ ์œผ๋กœ ์ดํ•ดํ•˜๊ธฐ๋Š” ์‰ฝ์ง€ ์•Š๋‹ค. ํŽ˜์ด์ง€๋žญํฌ ์Šค์ฝ”์–ด๋ง์˜ ํ•จ์˜๋ฅผ ์ถ”๋ฆฌ๊ณ  ๊ทธ ๊ณ„์‚ฐ ๊ณผ์ •์€ ์ž˜ ๋Œ์•„๋ณด์ง€ ์•Š๋Š”๋‹ค. ๋‚˜๋„ ๊ทธ๋žฌ๋‹ค.

ํŽ˜์ด์ง€๋žญํฌ๋ผ๋Š” ์Šค์ฝ”์–ด, ์ฆ‰ ํ•œ ์›น ํŽ˜์ด์ง€๊ฐ€ ๋งํฌ๋กœ ๊ตฌ์„ฑ๋œ ์›น ํ’๊ฒฝ์—์„œ ์ง€๋‹ˆ๋Š” ์ค‘์š”๋„๋ผ๋Š” ๊ฐœ๋…์ด ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ์˜ ๊ทนํ•œ ๋ถ„ํฌ(limiting distribution)์™€ ๊ฐœ๋…์ ์œผ๋กœ ์—ฐ๊ฒฐ๋œ๋‹ค. ๋‚ด์šฉ์„ ๊ฐ„๋‹จํžˆ ์‚ดํŽด๋ณด๋„๋ก ํ•˜์ž.

PageRank Model

์ผ๋‹จ ํŽ˜์ด์ง€์™€ ๋ธŒ๋ฆฐ์˜ ๋…ผ๋ฌธ์—์„œ ๋‹ค๋ฃฌ ๋ชจ๋ธ๋ง์˜ ์„ธํŒ…์„ ๊ฐ„๋‹จํžˆ ์‚ดํŽด๋ณด์ž.

์ด์ œ ์›นํŽ˜์ด์ง€ ii์˜ Broken Rank pip_i์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

pi=โˆ‘jโ†’ipjmj=โˆ‘k=1nLijpjmj p_i = \sum_{j \to i} \dfrac{p_j}{m_j} = \sum_{k=1}^{n}L_{ij}\dfrac{p_{j}}{m_j}

์ฆ‰, ii ์›น์‚ฌ์ดํŠธ์˜ 'Broken Rankโ€™๋Š” ii๋กœ ์—ฐ๊ฒฐ๋œ ํŽ˜์ด์ง€๋“ค์˜ Broken Rank์— ์˜ํ•ด ์ •ํ•ด์ง„๋‹ค. ์ด๋ฅผ ๊ณ„์‚ฐํ•˜๋Š” ๋ฐฉ๋ฒ•์€ ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. ํ•ด๋‹น ํŽ˜์ด์ง€๋“ค์˜ Broken Rank๊ฐ€ ๋†’์„์ˆ˜๋ก ๋‚˜์˜ ๋žญํฌ๋„ ๋†’์•„์ง„๋‹ค. ํ•ด๋‹น ํŽ˜์ด์ง€๊ฐ€ ๋” ๋งŽ์€ ๋งํฌ๋ฅผ ๊ฐ€์งˆ์ˆ˜๋ก ๊ทธ Broken Rank๋Š” ๋‚ฎ๊ฒŒ ํ‰๊ฐ€๋œ๋‹ค. mjm_j๋กœ ๋‚˜๋ˆ ์ง„ ๋ถ€๋ถ„์ด ์ด๋ฅผ ๋ฐ˜์˜ํ•œ๋‹ค.

์—ฌ๊ธฐ์„œ ์™œ ๊ตณ์ด "broken"์ด๋ผ๋Š” ํ‘œํ˜„์„ ์ผ๋Š”์ง€๋Š” ์ž ์‹œ ํ›„์— ๋‚˜์˜ค๋‹ˆ ์กฐ๊ธˆ๋งŒ ๊ธฐ๋‹ค๋ ค์ฃผ์‹œ๋ผ.

Broken rank as matrix

Broken rank๋ฅผ ๋งคํŠธ๋ฆญ์Šค๋กœ ํ‘œํ˜„ํ•ด๋ณด์ž.

p=[p1,โ€ฆ,pn]T p = [p_1, \dotsc, p_n]^T

L=[L11โ€ฆL1nโ‹ฎโ‹ฑโ‹ฎLn1โ€ฆLnn] L = \begin{bmatrix} L_{11}& \dotsc& L_{1n} \\ \vdots& \ddots& \vdots \\ L_{n1}& \dotsc& L_{nn} \end{bmatrix}

M=[m1โ€ฆ0โ‹ฎโ‹ฑโ‹ฎ0โ€ฆmn] M = \begin{bmatrix} m_{1}& \dotsc& 0 \\ \vdots& \ddots & \vdots \\ 0& \dotsc& m_{n} \end{bmatrix}

์ด๋ฅผ ํ™œ์šฉํ•˜๋ฉด,

p=LMโˆ’1p p = LM^{-1} p

LMโˆ’1=ALM^{-1} = A๋ผ๊ณ  ๋‘๋ฉด AA๊ฐ€ ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ์˜ ํ™•๋ฅ  ํ–‰๋ ฌ๊ณผ ์œ ์‚ฌํ•˜๋‹ค๋Š” ์ ์„ ์‰ฝ๊ฒŒ ํŒŒ์•…ํ•  ์ˆ˜ ์žˆ๋‹ค.

AT=[L11m1โ€ฆLn1m1โ‹ฎโ‹ฑโ‹ฎL1nmnโ€ฆLnnmn] A^T = \begin{bmatrix} \dfrac{L_{11}}{m_1}& \dotsc& \dfrac{L_{n1}}{m_1} \\ \vdots& \ddots& \vdots \\ \dfrac{L_{1n}}{m_n}& \dotsc& \dfrac{L_{nn}}{m_n} \end{bmatrix}

ATA^T๋ฅผ ๋“ค์–ด๋‹ค๋ณด์ž. ์ผ๋‹จ, ํ–‰์„ ๋”ํ•˜๋ฉด 1์ด ๋œ๋‹ค. ์ฆ‰, ii์—์„œ ii๋ฅผ ํฌํ•จํ•ด์„œ ์–ด๋””๋ก ๊ฐ€๋Š” ๊ฐ€์•ผ ํ•œ๋‹ค๋Š” ๋œป์ด๋‹ค. ๋‹ค์Œ์œผ๋กœ Lโ‹…L_\cdot์˜ ์ •์˜๋ฅผ ์‚ดํŽด๋ณด๋ฉด iโ†’ji \to j์˜ ์ดํ–‰ํ™•๋ฅ ์€ ii๊ฐ€ jj๋กœ ํ–ฅํ•˜๋Š” ๋งํฌ๋ฅผ ์ง€๋‹ ๊ฒฝ์šฐ๋Š” 1mi\frac{1}{m_i}๊ฐ€ ๋˜๊ณ , ๊ทธ๋ ‡์ง€ ์•Š์œผ๋ฉด 0์ด๋‹ค. ํŽ˜์ด์ง€์™€ ๋ธŒ๋ฆฐ์ด ์ •์˜ํ•œ random surfer๋ผ๋Š” ๊ฒŒ ๊ฒฐ๊ตญ ์ด๋Ÿฐ ๋‚ด์šฉ์ด๋‹ค. mim_i์˜ ๋งํฌ ์ค‘์—์„œ ํŠน๋ณ„ํžˆ ์„ ํ˜ธํ•˜๋Š” ๋งํฌ ์—†์ด ๋ฌด์ž‘์œ„๋กœ ํ•˜๋‚˜๋ฅผ ๊ณจ๋ผ์„œ ๋‚˜๊ฐ„๋‹ค๋Š” ๊ฐ€์ •์ด ์ˆจ์–ด ์ด๋Š” ์…ˆ์ด๋‹ค. ์•„์šธ๋Ÿฌ ํ•ด๋‹น ๋งํฌ๋ฅผ ์„ ํƒํ•˜๋Š” ๋ฐ์—๋Š” ํ˜„์žฌ์˜ ๊ฐ€๋Šฅ์„ฑ ์ด์™ธ์— ๊ทธ ์ „์˜ ์„ ํƒ์€ ๊ณ ๋ ค๋˜์ง€ ์•Š๋Š”๋‹ค. ์ด์ ์—์„œ ์ด๋ฒˆ ๊ธฐ์˜ ์„ ํƒ์— ๋ฐ”๋กœ ์ „๊ธฐ๋งŒ ์˜ํ–ฅ์„ ๋ผ์น˜๋Š” ๋งˆ๋ฅด์ฝ”ํ”„ ํ”„๋กœ์„ธ์Šค์˜ ๊ฐ€์ •๊ณผ ์ผ์น˜ํ•œ๋‹ค.

Why broken?

์™œ ๊นจ์ง„ ๋งํฌ์ธ๊ฐ€? ๋ˆˆ์น˜๊ฐ€ ๋น ๋ฅธ ์‚ฌ๋žŒ์ด๋ผ๋ฉด ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ์—์„œ ํ•ด๋‹น ์ฒด์ธ์ด ์ˆ˜๋ ดํ•˜๋Š” ๋ถ„ํฌ๋ฅผ ์ง€๋‹ˆ๊ธฐ ์œ„ํ•œ ์กฐ๊ฑด์„ ์•Œ๊ณ  ์žˆ์„ ๊ฒƒ์ด๋‹ค. ๊ทนํ•œ ๋ถ„ํฌ๋ฅผ ์ง€๋‹ˆ๋ ค๋ฉด ๋งˆ๋ฅด์ฝ”ํ”„ ํ™•๋ฅ  ํ–‰๋ ฌ์ด ์šฐ์„  irreducible ํ–‰๋ ฌ์ด์–ด์•ผ ํ•œ๋‹ค.

์ด ์กฐ๊ฑด์„ ๋ง๋กœ ํ’€๋ฉด ์–ด๋–ป๊ฒŒ ๋ ๊นŒ? ํ•ด๋‹น ์ƒํƒœ์—์„œ ์–ธ์  ๊ฐ€๋Š” ๋‹ค๋ฅธ ๋ชจ๋“  ์ƒํƒœ๋กœ ๊ฐˆ ์ˆ˜ ์žˆ์–ด์•ผ ํ•œ๋‹ค. ์ด๋ฅผ ์›น์‚ฌ์ดํŠธ ๊ฐ„์˜ ๋งํฌ๋กœ ๋‹ค์‹œ ํ’€์–ด๋ณด์ž. A ์‚ฌ์ดํŠธ์—์„œ B ์‚ฌ์ดํŠธ๋กœ ๊ฐˆ ์ˆ˜ ์—†์œผ๋ฉด ์•ˆ๋œ๋‹ค. ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ์—์„œ ํ™•๋ฅ  ํ–‰๋ ฌ์ด reducible ํ–‰๋ ฌ์ด๋ฉด ์ˆ˜๋ ดํ•˜๋Š” ์œ ์ผํ•œ ๊ทนํ•œ ๋ถ„ํฌ๋ฅผ ์ฐพ์„ ์ˆ˜ ์—†๋‹ค. ๋‹ค์Œ์˜ ์˜ˆ๋ฅผ ๋ณด์ž.

A=[0010010100010000010100010] A = \begin{bmatrix} 0 & 0 & 1 & 0 & 0 \\ 1 & 0 & 1 & 0 & 0 \\ 0 & 1 & 0 & 0 & 0 \\ 0 & 0 & 1 & 0 & 1 \\ 0 & 0 & 0 & 1 & 0 \end{bmatrix}

์•„์ด๊ฒ๋ฐธ๋ฅ˜ 1์— ํ•ด๋‹นํ•˜๋Š” ์•„์ด๊ฒ๋ฒกํ„ฐ๋Š” ๋‘ ๊ฐœ๊ฐ€ ์กด์žฌํ•œ๋‹ค. ๊ฐ๊ฐ

p=[13,13,13,0,0] or p=[0,0,0,12,12] p = [\dfrac{1}{3}, \dfrac{1}{3} , \dfrac{1}{3} , 0, 0 ] \text{~or~} p = [0, 0, 0, \dfrac{1}{2}, \dfrac{1}{2} ]

ํ™•๋ฅ  ํ–‰๋ ฌ์ด ๋น„๊ธฐ์•ฝ ํ–‰๋ ฌ(reducible matrix)์ด๋ฉด, ์›น ํŽ˜์ด์ง€์— ๊ด€ํ•ด์„œ ์œ ์ผํ•œ ๊ทนํ•œ ๋ถ„ํฌ๋ฅผ ์ฐพ์„ ์ˆ˜ ์—†๋‹ค. ์‹œ์ž‘์ด ์–ด๋””์ธ์ง€์— ๋”ฐ๋ผ์„œ ์ „ํ˜€ ๋‹ค๋ฅธ ๊ทนํ•œ ๋ถ„ํฌ๋ฅผ ์–ป๊ฒŒ ๋œ๋‹ค. ์œ„์˜ ์˜ˆ์—์„œ ๋งŒ์ผ 1,2,3 ์‚ฌ์ดํŠธ์—์„œ ์‹œ์ž‘ํ–ˆ๋‹ค๋ฉด ์ฒซ๋ฒˆ์งธ ๊ทนํ•œ ๋ถ„ํฌ๋ฅผ, 4,5 ์‚ฌ์ดํŠธ์—์„œ ์ถœ๋ฐœํ–ˆ๋‹ค๋ฉด ๋‘๋ฒˆ์งธ ๊ทนํ•œ ๋ถ„ํฌ๋ฅผ ์–ป๊ฒŒ ๋  ๊ฒƒ์ด๋‹ค.

PageRank score as share

๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ์„ ๋‹ค๋ฃจ๋Š” ๋ถ„์„์—์„œ ์ด๋Ÿฐ ๊ฒฝ์šฐ๋Š” ์ข…์ข… ์ƒ๊ธธ ์ˆ˜ ์žˆ๋‹ค. ์ด๋ฅผ ํ•ด๊ฒฐํ•˜๋Š” ๊ฐ€์žฅ ์‰ฌ์šด ๋ฐฉ๋ฒ•์€ ์–ด๋–ค ์ƒํƒœ์— ๊ณ ์ฐฉ๋˜์–ด ๋ฒ—์–ด๋‚  ์ˆ˜ ์—†์„ ๋•Œ, ๋ฒ—์–ด๋‚  ์ˆ˜ ์žˆ๋Š” ์–ด๋–ค ๊ธฐ์ œ๋ฅผ ๋งˆ๋ จํ•ด์ฃผ๋Š” ๊ฒƒ์ด๋‹ค. ์˜ˆ๋ฅผ ๋“ค์–ด, ํ”Œ๋ ˆ์ด์–ด๊ฐ€ ์ผ์ •ํ•œ ํ™•๋ฅ ๋กœ ์‹ค์ˆ˜๋ฅผ ํ•˜๊ฒŒ ํ—ˆ์šฉํ•œ๋‹ค๊ฑฐ๋‚˜ ํ•˜๋Š” ์ด๋ก ์ ์ธ ์žฅ์น˜๊ฐ€ ๋งŽ์ด ํ™œ์šฉ๋œ๋‹ค.

ํŽ˜์ด์ง€๋žญํฌ ์—ญ์‹œ ๋น„์Šทํ•œ ํ•ด๋ฒ•์„ ๋ชจ๋ธ์— ๋„ฃ์—ˆ๋‹ค. ๋งํฌ๊ฐ€ ์—†๋”๋ผ๋„ ์ผ์ •ํ•œ ํ™•๋ฅ ๋กœ ๋‹ค๋ฅธ ๋ชจ๋“  ๋งํฌ๋กœ ๋„˜์–ด๊ฐˆ ํ™•๋ฅ ์„ ์ž„์˜๋กœ ๋ถ€์—ฌํ•˜๋Š” ๊ฒƒ์ด๋‹ค. ์ด๋ฅผ ๋ฐ˜์˜ํ•œ ํŽ˜์ด์ง€๋žญํฌ์˜ ์ •์˜๋Š” ์•„๋ž˜์™€ ๊ฐ™๋‹ค.

pi=1โˆ’dn(A)+1โˆ’dndโˆ‘jโ†’ipjmj(B)=1โˆ’dn+dโˆ‘k=1nLijpjmj p_i = \overset{(A)}{\dfrac{1-d}{n}} + \overset{(B)}{\vphantom{\dfrac{1-d}{n}} d \sum_{j \to i} \dfrac{p_j}{m_j}} = \dfrac{1-d}{n} + d \sum_{k=1}^{n}L_{ij}\dfrac{p_{j}}{m_j}

dd๋Š” ์–ด๋–ค ์‚ฌ์ดํŠธ์—์„œ ๋งํฌ๊ฐ€ ์กด์žฌํ•˜๋Š” ๋‹ค๋ฅธ ์‚ฌ์ดํŠธ๋กœ ์˜ฎ๊ฒจ๊ฐˆ ํ™•๋ฅ ์„ ์˜๋ฏธํ•œ๋‹ค. ๋”ฐ๋ผ์„œ (1โˆ’d)(1-d)๋Š” ๋งํฌ ์œ ๋ฌด์™€ ๊ด€๊ณ„ ์—†์ด nn ๊ฐœ์˜ ์‚ฌ์ดํŠธ ์ค‘ ์ž„์˜์˜ ๋‹ค๋ฅธ ์‚ฌ์ดํŠธ๋กœ ์˜ฎ๊ฒจ๊ฐˆ ํ™•๋ฅ ์ด๋‹ค.

์ด๋ฅผ ํ–‰๋ ฌ๋กœ ๋‚˜ํƒ€๋‚ด๋ฉด ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค. ptp_t ๊ธฐ์˜ ํŽ˜์ด์ง€๋žญํฌ๊ฐ€ ์ฃผ์–ด์ ธ ์žˆ๋‹ค๋ฉด, ๋งํฌ๋ฅผ ํ†ตํ•œ ํŽ˜์ด์ง€ ์ด๋™์„ ๊ฑฐ์นœ ์ดํ›„์˜ ํŽ˜์ด์ง€๋žญํฌ pt+1p_{t+1} ๋‹ค์Œ๊ณผ ๊ฐ™๋‹ค.

pt+1=(1โˆ’dn1n+dLMโˆ’1)โž(โˆ—)pt p_{t+1} = \overbrace{\left( \dfrac{1-d}{n} \bm{1}_n + d L M^{-1} \right)}^{(*)}p_{t}
1n\bm{1}_n์€ ๋ชจ๋“  ์›์†Œ๊ฐ€ 1์ธ nร—nn \times n ํ–‰๋ ฌ์ด๋‹ค. (โˆ—)(*)์€ ๊ธฐ์•ฝ ํ–‰๋ ฌ(irreducible matrix)์ด๊ณ , d>0d>0์ด ๋งŒ์กฑํ•˜๋ฉด ๋น„์ฃผ๊ธฐ ํ–‰๋ ฌ(aperiodic matrix)์ด ๋œ๋‹ค. ํŠน์ •ํ•œ ์‚ฌ์ดํŠธ ii์—์„œ ๋‹ค๋ฅธ ์‚ฌ์ดํŠธ๋กœ ๊ฐˆ ํ™•๋ฅ ์ด ๋ชจ๋‘ ์–‘์ˆ˜๊ฐ€ ๋˜๊ธฐ ๋•Œ๋ฌธ์ด๋‹ค.

์ด ๊ฒฝ์šฐ (โˆ—)(*)์„ ํ™•๋ฅ  ํ–‰๋ ฌ๋กœ ์ง€๋‹ˆ๋Š” ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ์€ ๊ทนํ•œ ๋ถ„ํฌ pโˆ—p^*๋ฅผ ์ง€๋‹ˆ๊ฒŒ ๋œ๋‹ค. ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ์˜ ๋…ผ๋ฆฌ์— ๋”ฐ๋ผ์„œ pโˆ—p^*๋Š” ์ดˆ๊ธฐ๊ฐ’ ํ˜น์€ ์›น์‚ฌ์ดํŠธ์˜ ์ดˆ๊ธฐ ์ง€๋ถ„ p0p_0์™€ ๋ฌด๊ด€ํ•˜๋‹ค.

์ด ๊ทนํ•œ ๋ถ„ํฌ pโˆ—p^*๊ฐ€ ๋ฐ”๋กœ ํŽ˜์ด์ง€๋žญํฌ๋‹ค! ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ์˜ ๊ด€์ ์—์„œ ํŽ˜์ด์ง€๋žญํฌ๋ž€ ํŽ˜๋ก -ํ”„๋กœ๋ฒ ๋‹ˆ์šฐ์Šค ์ •๋ฆฌ์— ๋”ฐ๋ผ์„œ ์•„์ด๊ฒ๋ฐธ๋ฅ˜ 11์— ํ•ด๋‹นํ•˜๋Š” ์ขŒ ์•„์ด๊ฒ๋ฒกํ„ฐ๋ฅผ ์ฐพ๋Š” ๊ณผ์ •์ด๋‹ค.1 ๋ฌผ๋ก  ๊ตฌ๊ธ€์ด ๊ตฌ์‚ฌํ•˜๋Š” ์‹ค์ œ์˜ ์•Œ๊ณ ๋ฆฌ์ฆ˜์€ ์—ฌ๊ธฐ ์ ์€ ๋‚ด์šฉ๋ณด๋‹ค ํ›จ์”ฌ ๋ณต์žกํ•˜๊ณ  ์ •๊ตํ•˜๋‹ค. ๋‹ค๋งŒ ๊ทธ ํ•ต์‹ฌ์€ ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ์ด๋ผ๋Š” ์‚ฌ์‹ค์„ ๊ธฐ์–ตํ•ด๋‘์ž.

๊ทนํ•œ ๋ถ„ํฌ๊ฐ€ ํŽ˜์ด์ง€๋žญํฌ๊ฐ€ ๋œ๋‹ค๋Š” ์˜๋ฏธ๋Š” ๋ฌด์—‡์ผ๊นŒ? ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ์—์„œ ๊ทนํ•œ ๋ถ„ํฌ๋ž€ ๋ฌด์ž‘์œ„๋กœ ์ƒํƒœ๋ฅผ ์˜ฎ๊ฒจ๊ฐ€๋Š” ๊ฒƒ์ด ๋ฌดํ•œ์ด ๋ฐ˜๋ณต๋˜์—ˆ์„ ๋•Œ ๋„๋‹ฌํ•˜๊ฒŒ ๋˜๋Š” ๋ถ„ํฌ๋‹ค. ์ด๋Š” ์ถฉ๋ถ„ํžˆ ๊ธด ์žฅ๊ธฐ์— ๊ฐ ์ƒํƒœ๊ฐ€ ์ง€๋‹ˆ๊ฒŒ ๋˜๋Š” โ€˜์ง€๋ถ„โ€™(share)์œผ๋กœ ์ดํ•ดํ•  ์ˆ˜ ์žˆ๋‹ค.

์ด๋Ÿฌํ•œ ํ•ด์„์€ ์›น ์‚ฌ์ดํŠธ์—๋„ ์ž˜ ๋“ค์–ด ๋งž๋Š”๋‹ค. ์ˆ˜๋งŽ์€ ์›น ์„œํผ๊ฐ€ ์กด์žฌํ•˜๊ณ  ์ด๋“ค์ด ๋ฌด์ž‘์œ„๋กœ ์›น ์‚ฌ์ดํŠธ๋ฅผ ๋Œ์•„๋‹ค๋‹Œ๋‹ค๋ฉด, ์ด๋Ÿฌํ•œ ์ƒํƒœ์—์„œ ๊ฐ ์‚ฌ์ดํŠธ๊ฐ€ ์ฐจ์ง€ํ•˜๋Š” โ€˜์ง€๋ถ„โ€™ ํ˜น์€ ์ ์œ ์œจ์€ ์–ผ๋งˆ๋‚˜ ๋ ๊นŒ? ์ด ์ง€๋ถ„์ด ํ•ด๋‹น ์›น์‚ฌ์ดํŠธ๊ฐ€ ์ „์ฒด ์›น ํ’๊ฒฝ์—์„œ ๋ˆ„๋ฆฌ๋Š” '์ค‘์š”์„ฑโ€™์ด ๋  ๊ฒƒ์ด๋‹ค. ์•„์šธ๋Ÿฌ ์•ž์„œ ํŽ˜์ด์ง€๋žญํฌ์˜ ์ •์˜๊ฐ€ ๋™์–ด๋ฐ˜๋ณต์ฒ˜๋Ÿผ ๋Š๊ปด์กŒ๋˜ ์ด์œ ๋„ ์ด์ œ ์•Œ ์ˆ˜ ์žˆ๋‹ค. ์ด๋Š” ์žฅ๊ธฐ์— ๋„๋‹ฌํ•˜๊ฒŒ ๋˜๋Š” ์ผ์ข…์˜ ์ˆ˜๋ ด ์ƒํƒœ์ธ ์…ˆ์ด๋‹ค. ์ด๋ ‡๊ฒŒ ๋งˆ๋ฅด์ฝ”ํ”„ ์ฒด์ธ๊ณผ ํŽ˜์ด์ง€๋žญํฌ๊ฐ€ ์—ฐ๊ฒฐ๋œ๋‹ค!

Reference

Page, Larry, โ€œThe PageRank Citation Ranking: Bringing Order to the Web,โ€ http://ilpubs.stanford.edu:8090/422/1/1999-66.pdf. โ†ฉ๏ธŽ

Tibshirani, Ryan, โ€œPageRank,โ€
https://www.stat.cmu.edu/~ryantibs/datamining/lectures/03-pr.pdf.






๐Ÿ lostineconomics.com | Jun Sok Huhh


  1. https://anarinsk.github.io/lie-pf1/์„ ์ฐธ๊ณ ํ•˜๋ผ. โ†ฉ๏ธŽ