SEO 教程2: I.1 搜索引擎如何工作 ?

By Jiang | 5月 21, 2007

关于 SEO 你需要了解的基本事实是,搜索引擎不是人。这点很容易了解,人和搜索引擎查看网页的方式是不一样的。和人不一样,搜索引擎是文字驱动的。尽管技术飞速发展,搜索引擎还是不具有智能,它们无法感受到网站很酷的设计、无法欣赏影片中的声音和运动。相反,搜索引擎爬过网站,查看网站每一个条目,来了解网站的内容。这个大致解释并不精准,稍后我们将要看到,搜索引擎会执行几个动作将分离搜索结果 — 爬行(crawling),索引(indexing),处理(processing),计算相关度(calculating relevancy),重新检索(retrieving)

首先,搜索引擎爬过(crawl)网站来看它在哪儿。这个工作是由软件来执行,被成为爬虫或蜘蛛(或者 Googlebot, 因为它与 Google 有关)。蜘蛛跟着链接从一个页面到另一个页面,并且索引(index)他们发现任何东西。要知道网上有海量的网页(大约200亿),对于蜘蛛而言,要每天访问一个网站查看是否有新的页面或已有页面是否被更改是不可能的。有时候,蜘蛛可能一两个月都不会访问你的页面,这么这段时间,你的 SEO 效果也不会有作用。但你也无能为力,保持镇定即可。

你所能够做的就是检查爬虫从你的网站看到了什么。如前所述,爬虫不是人,它们不能看图片,动画电影,Java脚本,框架,密码保护页面和目录;所以如果你的网站上有海量的类似信息,你最好运行下面的蜘蛛模拟器(Spider Simulator)来查看这些甜品是否被爬虫看到。如果没有看到,它们就不会被爬过,不会被索引,不会被处理等等。总之一句话,对于搜索引擎而言,它们是不存在的。

Spider Simulator

Enter URL to Spider

当页面被爬过以后,下一步就是索引它的内容。被索引的页面存放在海量数据库内,稍后会在那进行分离。基本来说,这个索引的过程是识别能够最好描述页面的文字和措辞,并归入特定的关键词。对于人而言,要处理如此大量的信息是不可能的;但对于搜索引擎而言,它们只要执行任务就行。有时候,它们无法理解页面的意思,但是如果你通过优化网页来帮助它们,它们会更容易对你的网页进行正确分类,给网页带来更好的评分。

当搜索请求来临的时候,搜索引擎处理它 — 比如说,将搜索请求中的字符串和数据库中已索引的相比较。由于不止一个(事实上有数百万个)类似的网页包含这个搜索字符串,搜索引擎开始计算相关度,关于已索引页面与搜索字符串之间的相关度。

有许多不同的算法可以计算相关度。不同的算法对于每个普通影响因素诸如关键词密集度(keyword density)、链接(links)、和元标签(metatags)都有不同的权重。这也是不同的搜索引擎搜索相同字符串,结果通常不一样的原因。并且,众所周知,所有主流的搜索引擎,如 Yahoo!,Google,MSN 等,都周期性地更改它们的算法;如果你希望自己的网页保持在顶端,就必须跟进最新的变化。这是让你不断投入 SEO 的一个原因(另外的原因是你的竞争对手),如果你希望呆在顶端的话。

搜索引擎的最后一步动作是重新检索结果。基本上,这一步只是简单将结果在浏览器中显示出来 — 无穷尽的搜索结果按照关联度从重到轻依次排列。

原文链接: 1. How Search Engines Work

中文翻译: 总而言之,统而言之

Topics: 博客建设 | 11,234 views | 11 Comments »


11 comments | Add One

  1. SillySnail - 05/21/2007 at 5:01 下午 #


    PS:末尾把自己的blog名字写错了,小小地汗一下

  2. Jiang - 05/21/2007 at 5:10 下午 #

    我觉得这个教程非常基本,让你可以从根本上了解优化的原理,比单纯讲一些技巧要强。
    那个错别字比较汗,我记得修改了好几次,可恶的Google输入法;不过使用 Windows Live Writer 写文章,用微软拼音输入法不能中英文混合输入,真麻烦~~

  3. 偶爱偶家 - 05/21/2007 at 9:11 下午 #

    不错不错, 原创的更要支持一下. 谢了啊

  4. 积水成博客 - 04/6/2008 at 5:53 下午 #

    这个SEO教程,对搜索引擎的工作讲得很清楚,容易理解。学习了,谢谢。

  5. 上海灵格包装 - 04/14/2009 at 5:14 下午 #

    SEO效果是有的,不够百度的点击排名做得有点过了,第一页全是付费点击的。没法SEO!

  6. 公元五九二○ - 04/24/2009 at 11:56 上午 #

    出来乍道 给大家请安了

  7. 江同学 - 12/26/2009 at 9:00 上午 #

    非常感谢博主~~

  8. 视频聊天 - 01/13/2010 at 4:23 下午 #

    无穷尽的搜索结果按照关联度从重到轻依次排列

  9. 痕迹 - 03/4/2010 at 10:27 上午 #

    很有用,谢谢分享。

  10. coach wallet outlet - 04/27/2011 at 3:18 下午 #

    不错,学习了,很有用

  11. louis vuitton factory outlet - 04/27/2011 at 4:06 下午 #

    I just had time to read the first sentences now, but looks promising, and I’ll be sure to come back within the next day or two.All the best and thanks.

LinkWorth
Hostgator

酷站链接 (Featured Links)

最新评论 (Recent Comments)

  • air jordan shoe: 不错,挺厉害的~~
  • Hairstyles: 原来链接这么重要!
  • Haircuts: 有空试一下看看
  • CHI Flat Iron: 哇,这么多插件啊,慢慢看!
  • 诗酒如画: 1)备份你的WordPress数据库 推荐用WordPress Database Backup在后台操作.下载备份的压缩包或者是传到自己邮箱里都可以. 如果直接在数据库中备份的话,记得选择UTF8编码,切记. 2)备份你的程序...
  • north face wholesale: en ,我会试一试的。

搜索 (Search)

合作伙伴

推荐站点 (Recommendations)

Partner links

WordPressChina
  • 原创博客联盟