1PR的概念和计算
我们可以把互联网理解为由结点及链接组成的有向图,页面就是一个个结点,页之间的有向链接传递着页面的重要性。一个链接传递的 PR 值决定于链接所在页面的P值,发出链接的页面本身PR 值越高,所能传递出去的 PR 也越高。传递的 PR值也取于页面上的导出链接数目。对于给定 PR 值的页面来说,假设能传递到下级页面100PR页面上有10个导出链接每个链接能传递10份PR,页面上有20个导出链接的话每个链接只能传递5份PR。所以一个页面的PR值取决于导入链接总数,链接源页面PR值,以及链接源页面上的导出链接数目。
PR值计算公式是:
PR(A)=(1-d) + d(PR(t)/C(t)+..· +PR(t)/C(t))
A代表页面A。
PR(A)则代表页面A的PR值
d为阻尼指数。通常认为d-0.85
h”t代表链接向页面A的页面到t
C代表页面上的导出链接数目。C(t)即为页面上的导出链接数目
从概念及计算公式都可以看到,PR 值必须经过多次送代计算才能得到。页面AR值取决于链接向A的页面山至页面的PR值,而为至而面的PR 值又取决于其页面的 PR值,其中很可能还包含页面 4。计算时先给所有页面设定一个初始值,经过一定次数的迭代计算后,各个页面的PR值将趋于稳定,收敛到一个特定值。研究证明,无论初始值怎么选取,经过迭代计算的最终PR 值不会受到影响。
对阻尼系数做个简要说明。考虑如图 2-34 所示这样一个循环(实际网络上是一定存在这种循环的)。
A000
Y
图2-34链接构成的循环
外部页面Y向循环注入 PR 值,循环中的页面不停迭代传递PR,如果没有阻尼系数,循环中的页面PR将达到无穷大。引入阻尼系数,使PR在传递时自然衰减,才能将PR计算稳定在一个值上。