点击这里给我发消息 点击这里给我发消息
首页 > 行业资讯 > IT风云>详细内容

搜索引擎优化的定义及搜索引擎的基本工作原理

添加时间:2010-1-5
    相关阅读: 网页设计 行业网站 网站推广 搜索引擎优化 网页 设计 SEO

WIKI定义

SEO是 Search Engine Optimization 的缩写,用英文描述就是 touse some technics to make your website in the top places in Search Engine when somebody is using Search Engine to find something,翻译成中文就是“搜索引擎优化”,一般可简称为搜索优化。

SEO 的主要工作是通过了解各类搜索引擎如何抓取互联网页面、如何进行索引以及如何确定其对某一特定关键词的搜索结果排名等技术,来对网页进行相关的优化,使其提高搜索引擎排名,从而提高网站访问量,最终提升网站的销售能力或宣传能力的技术。

给搜索引擎下一个定义是非常困难的。一千个人就有一千个搜索引擎:有人认为搜索引擎就是百度,有人认为搜索引擎就是 Google,有人认为搜索引擎就是 Yahoo。如果非要给个定义,就让我们来看看微软大百科全书(MSN Encarta)是怎么定义搜索引擎的吧:

Search Engine,,software program that helps users find information stored on a personal computer,or a network of computers,such as the Internet。A user enters search terms,typically by typing a keyword or phrase,and the search engine retrieves a list of World Wide Web (WWW) sites,personal computer files,or documents, either by scanning the content stored on the computers or computer networks being searched or by parsing (analyzing) an index of their stored data。

搜索引擎是帮助用户查找存储在个人电脑、计算机网络如互联网上的信息的件程序。用户输入搜索项目,通常是通过录入一个关键词或短语,搜索引擎通过描被搜索的计算机和计算机网络,或者分解(分析)它们数据的索引,返回万维网站点、个人电脑文件或文档的列表。

国内的一些解释

搜索引擎优化是搜索引擎营销的常见形式之一。所谓搜索引擎优化,也就是针对各种搜索引擎的检索特点,让网页设计适合搜索引擎的检索原则(即搜索引擎友好),从而获得搜索引擎收录并在排名中靠前的各种行为。如对于基于 META 标签检索的搜索引擎,在 META 标签中设置有效的关键词和网站描述,对于以网页内容相关性为主的蜘蛛型搜索引擎,则通过在网页中增加关键词的密度,或者专门为搜索引擎设计一个便于检索的页面(如sitemap.htm、roberts.txt)。

Robin 根据自己对搜索引擎优化两年多的研究而总结出的搜索引擎优化定义:搜索引擎优化是这么一种技术,即是遵循搜索引擎科学而全面的理论机制,对网站结构、网页文字语言和站点间的互动外交策略等进行合理规划部署来发掘网站的最大潜力而使其在搜索引擎中具有较强的自然排名竞争优势,从而对促进企业在线销售和强化网络品牌起到作用。

目前为止,比较权威的定义是:搜索引擎优化,指遵循搜索引擎的搜索原理,对网站结构、网页文字语言和站点间互动外交策略等进行合理规划部署,以改善网站在搜索引擎的搜索表现,进而增加客户发现并访问网站的可能性的这样一个过程。搜索引擎优化也是一种科学的发展观和方法论,它随着搜索引擎的发展而发展,同时也促进了搜索引擎的发展。

搜索引擎的基本工作原理

现在互联网上存在的网页数量是数以百亿千亿计的,这些网站存储在不同的服务器上,分布在世界各地的数据中心和机房。

对于搜索引擎来说,要抓取互联网上所有的网页几乎是不可能的,从目前公布的数据来看,容量最大的搜索引擎也不过是抓取了整个网页数量的百分之四十左右。一方面原因是抓取技术存在瓶颈,无法遍历所有网页,有许多网页无法从其它网页的链接中找到;另一个原因是存储技术和处理技术的问题,如果按照每个页面平均大小 20K 计算(包含图片),100亿网页的容量是 100 2000G字节,即使能够存储,下载也存在问题(按照一台机器每秒下载20K计算,需要 340台机器不停的下载一年时间,才能把所有网页下载完毕)。同时,由于数据量太大,在提供搜索时也会有效率方面的影响。因此,许多搜索引擎的网络蜘蛛只是抓取那些重要的网页,而评价重要性的主要依据是某个网页的链接深度。

有人会认为搜索引擎在接收到搜索请求时,会实时地从全球所有的服务器上查询信息,并把查询结果展示在用户面前,这其实是一种误解。如果搜索引擎是这样工作的,那么查询一条信息可能要等上好几年才能得到搜索结果,这还不包括期间网页发生的变化。

实际上,搜索引擎会预先去拜访大量的网站,并把这些网页的部分信息预先存储在自己的服务器上,这样,当用户搜索的时候,其实是在搜索引擎自己的服务器中进行查询,就像我们在自己的电脑中查询文件一样。

搜索引擎是非常复杂的技术,但是其基本排序。

一、抓取

搜索引擎首先会派出一种被称作“蜘蛛”或者是“机器人”的软件,存在于互联网上的网站,并沿着网页上的链接从一个网页到另一个网页,从一个网站到另一个网站。为保证采集的资料最新,它还会回访已抓取过的网页。

二、索引

由分析索引系统程序对收集回来的网页进行分析,提取相关网页信息(包括网页所在URL、编码类型、页面内容包含的所有关键词、关键词位置、生成时间、大小、与其它网页的链接关系等),根据一定的相关度算法进行大量复杂计算,得到每一个网页针对页面文字中及超链中每一个关键词的相关度(或重要性),然后用这些相关信息建立网页索引数据库。

三、排序

当用户输入关键词搜索后,由搜索系统程序从网页索引数据库中找到符合该关键词的所有相关网页。因为所有相关网页针对该关键词的相关度早已算好,所以只需按照现成的相关度数值排序,相关度越高,排名越靠前。

最后,由检索器将搜索结果的链接地址和页面内容摘要等内容组织起来,返回给用户。

张何,1998年开始关注互联网,在电子商务、行业网站推广、搜索引擎优化、网站运营的赢利模式分析方面具有独到的心得。现为徐州网上礼品城(www.xzlpc.com)、中国创业投资网(www.28182.com)运营部经理。

咨询热线:020-85648757 85648755 85648616 0755-27912581 客服:020-85648756 0755-27912581 业务传真:020-32579052
广州市网景网络科技有限公司 Copyright◎2003-2008 Veelink.com. All Rights Reserved.
广州商务地址:广东省广州市黄埔大道中203号(海景园区)海景花园C栋501室
= 深圳商务地址:深圳市宝源路华丰宝源大厦606
研发中心:广东广州市天河软件园海景园区 粤ICP备05103322号 工商注册