Google PageRank: 我们都了解它什么 – 众人解说 PageRank 之1

By Jiang | 10月 29, 2007

六月份的时候,总统博客曾经翻译了 Google PageRank: What Do We Know about It? 一文的目录。这篇来自 SmashingMagazine 的文章,从多个角度详细地介绍了 Google PageRank 的相关知识,很有价值。但由于此文较长,当时并没有完全翻译,仅仅介绍了目录部分。从今天开始,本站将陆续将正文部分翻译出来。

1.1 什么是 PageRank?

  • “PageRank [只]是 Google 用于衡量一个网页相关性或重要的指标之一。”[PageRank Explained Correctly]
  • “Google 根据多个参数决定排名。在这些参数中,PageRank 算法是大家最为熟悉的。PageRank 包括两项内容:这个页面有多少来自其他页面的链接,以及这些链接站点的质量。来自 PageRank 5 或 6 的网站的链接,比如 www.cnn.com 和 www.nytimes.com ,效果要比来自不受好评的网站强两倍。”[Google Librarian Central]
  • “PageRank 只是衡量一个网页重要性的指标,而与此网页的主题相关性无关。主题相关性是根据网页内的因素所决定的,比如关键词密度,标题标签,以及其他。”[PageRank: An Essay]

1.2 PageRank 如何工作?

  • 没有人真正知道。“没有人真正知道 Google 目前是怎样计算 PageRank 的。”[Google PageRank Explained]
  • PR(A) = (1-d) + d(PR(t1)/C(t1) + … + PR(tn)/C(tn)).
    “这是计算网页 PageRank 的公式。在此公式里,’t1 – tn’ 是链接到 网页A 的网页,’C’ 是那个网页外向链接的数目,’d’ 是阻尼系数,通常为 0.85。”[Google’s Page Rank]
  • 我们可以将公式简化为:一个网页的 PageRank = 0.15 + 0.85 * (从每个指向这个网页的页面所“share(分享)”的 PageRank) ,“share” = 外部链接所在页面的 PageRank 值除以其网页外部链接数。每个网页都“投票”给它链接到的所有页面。它投出的 PageRank 比它自己页面 PageRank 略小(自身值 * 0.85)。这个值要和此页面上的所有链接平均分享。[The Importance of PageRank]
  • “从这点考虑,我们可以得出结论:一个来自 PageRank 4 拥有 5 个外向链接页面上的链接,要比一个 PageRank 8 拥有 100 个外向链接页面上的链接,更有价值。链接到你网页的页面的 PageRank 非常重要,不过其页面上链接的个数同样重要。一个网页上的链接越多,你所能够从这个网页获取的价值就越少。”[Google’s Page Rank]
  • “PageRank [...] 使用链接结果作为衡量一个独立网页价值的标尺。Google 将从 网页A 指向 网页B 的链接视为一个投票,网页A投票,投向网页B。Google 当然不仅仅考虑得票的多少,或者说是一个网页得到的链接数;同时它还分析投票页面的行为。投票表示向对方网页增加权重,帮助增加其他网页变得‘重要’。”[Google: Technology]
  • “对于 PR 而言,并非所有网页权重相同。‘重要的’页面给你带来的PR 比‘非重要’页面要多。[...] PR 传播的一个参数就是‘投票’网页中外部链接的数量。因此,一个 PR 4 但只有一个外向链接给你带来的权重,要比一个 PR 5 但是有 100 个外向链接要多。一个典型的例子是著名的 milliondollarhomepage(百万美元主页)。这个网页的 PR 7,拥有成千个外向链接,然而它的给你带来的权重却很少。”[Google PageRank Explained]
  • Page Rank 越高越难达到
    “PageRank 算法采用的对数计算。和地震登记采用的是指数公式计算一样,Google PageRank 背后也使用相同的数学公式。从 PR0 到 PR1 需要前行一步;要升到 PR3 要多一些努力;要升到 PR4 需要更多的努力;要升到 PR5 还需要等多的努力,如此等等。”[Google Page Rank FAQ]

Google PageRank

[via einfach-persoehnlich]

  • “PageRank 并不将整个网站作为一个整体考虑;它计算的是每个独立网页。进一步讲,网页A 的 PageRank 是根据所有指向 网页A 的外部链接的页面的 PageRank 值递归计算的。”[The Page Rank algorithm]
  • “Google 将 PageRank 与复杂的文本匹配技术一起,来考虑一个网页得重要性和用户搜索的相关性。Google 检查一个网页内容的所有方面(以及链接向他们的页面内容)来判断它是否适合用户的查询。”[What Is Google PageRank?]
  • “Google 每几个月计算一次网页 PR (PR更新)。每次更新之后,Google 给所有的网页新的 PR ,直到下一次 PR 更新。新的网站运行之后 PR 为 0,直到下一次更新,Google 才会赋给相应的 PR。” [Google PageRank Explained]
  • “Google PageRank 一直都在计算,但是我们每三个月左右才能看到 Google 工具栏(或其他在线 PR 工具)有新的更新。”[Reuben Yau]
  • PageRank 并非只有 0 到 10。PageRank 是一个浮点数。“将 PageRank 想象为一个浮点数是更为准确的。当然我们内部的 PageRank 等级绝不是在工具栏显示的 0 – 10 那么简单。【译者注:浮点数是指包括整数部分和小数部分组成的数,这里意在说明,PageRank 并不只有0 – 10 这 11 个整数。】”[Matt Cutts]
  • “我们可以肯定,到达每个新台阶的难度与前一级难度相比,此难度曲线类似于指数曲线。我个人曾经做过一些这方面的研究,结果表明,这个难度指数曲线的基数大约是 4 。那么到达 PR6 的难度大约是到达 PR5 难度的 4倍。[...] PR 6 上限与PR 6 下限的网页相比,外部链接数可能相差几百个,甚至几千。”[Top 10 Google Myths Revealed]
  • “可以确信 PageRank 是通过对数曲线计算的。这意味着 PR4 与 PR5 的差别大约是 PR3 与 PR4 差别的 5-10 倍。因此,PagePank 2 与 PageRank 4 的链接网页相差 100 倍。这意味着如果你得到一个 PageRank 6 的链接,你就可以得到其 0.1% 的权重。如果你的朋友大部分都是 PR2 或 PR3,那么你就可能走在了游戏前头。”[Importance of Google PageRank]
  • “PageRank 是基于进入链接的,但并不仅仅看链接的多少。PageRank 还看中进入链接的价值。要找到一个进入链接的价值,找到源网页,除以该网页上的链接数。值需要有几个能够给你足够多权重的网页,就可以达到 PR6 或 PR7。”[Top 10 Google Myths Revealed]
  • “Google 努力找出既受好评又相关的网页。如果两个页面具有相同的信息来匹配搜索项,我们通常选择较信任的网站来给出链接。然而,我们也会选择外部链接少或者 PageRank 低的网页,如果有信息表明他们更相关的话。举个例子,一个全部内容专注于南北战争的网页比仅仅提到南北战长的网页更有用,即便那篇文章来自值得诸如 time.com 等信任的网站。”[Google Librarian Central]
  • 链接并没有转移,他们只是投票。“当一个网页投票给其他网页的时候,他们自己的 PageRank 并没有因为投票而减少。网页的投票行为并没有将网页的 PageRank 转移减少到 0 。它不是 PageRank 的环子一。它只是关于网页 PageRank 值得一个投票。”[Page Rank Explained]
  • “我们从论文‘The Anatomy of a Large-Scale hypertextual Web Search Engine(大规模超文本网页搜索引擎剖析)’得知,一个网页的 PageRank 值是通过分享那些链接到此网页的 PageRank,进行递归计算得到的。”[Google PageRank]
  • 爬虫不会一直分析网站。“他经常需要两整月的时间来更新你的全部进入链接,包括发现,统计,计算,并显示为反向链接。”[Google FAQ]

众人解说 PageRank 目录,内容未完待续。。。

Topics: 博客建设 | 9,172 views | 19 Comments »


19 comments | Add One

  1. ken - 10/29/2007 at 9:01 上午 #

    少一点关注,多一点作品
    这才是博客~

  2. Jiang - 10/29/2007 at 9:12 上午 #

    谢谢支持,我会继续给大家带来好的文章;
    也希望大家继续支持哦!

  3. 影子传说 - 10/29/2007 at 11:14 上午 #

    整理的不错,收藏了.

  4. 任平生 - 10/29/2007 at 11:56 上午 #

    请教一下 net域名会不会给比较大的权重?

  5. Jiang - 10/29/2007 at 12:33 下午 #

    @任平生,域名对于 PageRank 基本没有影响,下面的章节会继续介绍影响 PageRank 的因素,似乎没有 domain 什么事,呵呵。

  6. 任平生 - 10/29/2007 at 12:43 下午 #

    那我的这个域名怎么就一下子从0变到4了啊

  7. Jiang - 10/29/2007 at 12:49 下午 #

    晕,你来夸自己的域名来了啊;
    我还有个新站,pr也直接从0到4了呢,只有一个网页 :)

  8. Kevin - 10/29/2007 at 1:54 下午 #

    Page Rank对于域名 当然有区别,edu org 全都有优势,总统你到底懂不懂啊,而且对于现在的GooglePR来说 已经完全不像文章中所说的了,PR的得出 其中包含访问量、网页质量、和网页链接 以及付费链接等等多重因素影响 这篇文章我看了一下 根本没用,你浪费时间了

  9. 西岸 - 10/29/2007 at 2:19 下午 #

    虽然我的pr也升了,但已经对它没什么感觉了

    不过了解一下相关知识或原理还是有意义的

  10. Jiang - 10/29/2007 at 2:39 下午 #

    @Kevin,从哪儿看到的 PageRank 跟域名有区别啊?想了解一下。

  11. 任平生 - 10/29/2007 at 6:59 下午 #

    不是,我就是想问下为啥没有实质内容,也没有什么好的站点链接,却变成4了,很奇怪而已,呵呵

  12. Jiang - 10/29/2007 at 7:04 下午 #

    @任平生,等下我将你的网站也加入到前天那个网页;有兴趣的话也欢迎你来参与我最喜欢的网站评选啊 :)

  13. 夜火 - 10/29/2007 at 8:51 下午 #

    其实说白了就是外部连接的数量与质量
    唉~,我的PR原来还在山脚的山脚下啊,革命尚未成功。。。。。。。

  14. PR是个啥?(下) | Web 2 Life - 10/30/2007 at 4:46 上午 #

    [...] PR并不只是如前文讲的正向链接和反向链接这两项这么简单,总统也发表了一篇关于PR的文章,介绍的比宅哥要详细的多得多,但是宅哥今天要说的不是技术。 [...]

  15. bbon - 10/30/2007 at 12:28 下午 #

    我的也是,这几天突然从2变到3了,不知是为什么?

  16. !CnSoLoer - 11/11/2007 at 5:35 下午 #

    多干事,少说话

  17. !CnSoLoer - 11/11/2007 at 5:36 下午 #

    太注重那东西,站都没得做了

  18. Jiang - 11/11/2007 at 8:34 下午 #

    呵呵,其实这个系列主要是希望大家对于 Google PageRank 更了解一下;这份资料整理得非常全面,也比较有权威,因此主要是给大家一个很好的参考资料。

  19. 阿里山民宿 - 04/1/2011 at 11:35 上午 #
LinkWorth
Hostgator

酷站链接 (Featured Links)

最新评论 (Recent Comments)

  • air jordan shoe: 不错,挺厉害的~~
  • Hairstyles: 原来链接这么重要!
  • Haircuts: 有空试一下看看
  • CHI Flat Iron: 哇,这么多插件啊,慢慢看!
  • 诗酒如画: 1)备份你的WordPress数据库 推荐用WordPress Database Backup在后台操作.下载备份的压缩包或者是传到自己邮箱里都可以. 如果直接在数据库中备份的话,记得选择UTF8编码,切记. 2)备份你的程序...
  • north face wholesale: en ,我会试一试的。

搜索 (Search)

合作伙伴

推荐站点 (Recommendations)

Partner links

WordPressChina
  • 原创博客联盟