打字猴:1.700515522e+09

1700515522

1700515523 可这仍然会让他们面临一个挑战：如何客观评价一个网站的重要性？

1700515524

1700515525 以一个小型网络为例，如图4-2所示。首先，给每个网站设定相同的权重。然后，让我们把网站想象成一个桶，给每个桶里放8个球，表示网站的初始权重相同。现在，每个网站必须将球交给它链接的其他网站，如果链接多个网站，那么就将球均分给那些网站。如图4-3所示，由于网站A链接了网站B和网站C，它将为每个网站提供4个球；而网站B只链接了网站C，它就需要将拥有的8个球全部放入网站C的桶中。第1轮分配后，网站C得到的小球数最多。

1700515526

1700515527

1700515528

1700515529

1700515530 图　4-2

1700515531

1700515532 但是我们需要继续重复这个分配过程，因为现在位于最高排名的网站C链接了网站A，所以又会产生新的分配结果。9轮重复分配过程中各网站小球数量的变化情况如图4-4所示。

1700515533

1700515534

1700515535

1700515536

1700515537 图　4-3

1700515538

1700515539

1700515540

1700515541

1700515542 图　4-4

1700515543

1700515544 到这一步，它还算不上是一个特别好的算法，因为不稳定，并且效率相当低，没有达到理想算法的两个关键标准。佩奇和布林的洞见之伟大在于，他们意识到，需要找到一种方法，通过观察网络的连通性来分配球。结果，他们在线性代数中找到了一个诀窍，可以一步算出正确的分布情况。

1700515545

1700515546 这种算法从构建一个矩阵开始，该矩阵描述球在网站间的重新分配方式。矩阵的第1列表示球从网站A到其他网站的分配比例：0.5转到网站B，0.5转到网站C。由此，可以得到球的重分配矩阵：

1700515547

1700515548

1700515549

1700515550

1700515551 难点是寻找这个矩阵特征值为1的特征向量，这是一个与该矩阵相乘不会发生改变的列向量。找到特征向量的方法我们在大学本科时就学过了，因此在这个网络中我们发现，通过重分配矩阵找到的列向量非常稳定：

1700515552

1700515553

1700515554

1700515555

1700515556 注：矩阵的乘法运算规则是：

1700515557

1700515558

1700515559

1700515560

1700515561 这就表明，如果我们按照2：1：2的比例给各网站分配球，会看到这个权重比例是稳定的。用之前9轮分配的例子中得到的数据也可以验证这一结论，各网站拥有的球的比例总是约等于2：1：2。

1700515562

1700515563 矩阵的特征向量是在数学和其他科学领域中非常有效的一种工具，是量子物理中用来计算粒子能级的秘密武器，可以用于研究旋转流体的稳定性（比如旋转的恒星或者病毒的繁殖率），甚至可以用于研究素数在所有数字中是怎样分布的问题。

1700515564

1700515565 通过计算网络连通性的特征向量，我们发现网站A和网站C的排名应该是相同的。虽然网站A只连接到一个网站（网站C），但由于网站C的权值较高，它会赋予网站A较高的权值。

1700515566

1700515567 这是算法的核心基础，但需要加入一些额外的细节处理才能使其充分发挥作用。例如，该算法可能需要考虑一些异常情况：如果存在未链接其他网站的孤立网站，它的球会无法重新分配。

1700515568

1700515569 尽管基础引擎是公开的，但算法内部的一些重要参数还是保密的，并且随着时间的推移不断发展变化、更新换代，这些在一定程度上使得算法难以被破解。谷歌算法最吸引人的地方在于它本身的健壮性和防止欺骗的策略——一个网站很难在自己的网站上做手脚来提高排名，它必须依靠其他网站来提升自己的排名。

1700515570

1700515571 如果你关注一下谷歌搜索，就会发现排名很靠前的网站主要都是新闻媒体网站和大学官方网站，比如牛津大学、哈佛大学的官网。许多外部网站都会链接到大学网站上的研究资料及观点页面，这正是由于这些大学的研究成果受到了世界各地许多人的关注。

[ 上一页 ] [ :1.700515522e+09 ] [ 下一页 ]