点击这里给我发消息 点击这里给我发消息

站内代码优化:Google蜘蛛抓取页面上的内容分析及优化方法

添加时间:2013-12-6
    相关阅读: 搜索引擎优化 网页 设计 南方网景 SEO 技术 页面

搜索引擎的工作原理简单的概括就是:蜘蛛爬取无数的页面,然后分析页面的内容和链接方式,然后把这些数据存入索引库。当用用户搜索时,搜索引擎就从索引库中调出一系列搜索结果,然后根据网页的相似度和权重进行排序。即:抓取-收录-排名。

所以做搜索引擎优化最基本的几点一定要做好:

1、让蜘蛛能快速抓取网页和收录(需要一个系统的网站内链架构,和性能优化)。

2、页面内容要符合蜘蛛的喜好或是符合搜索引擎的排序依据(网页代码的优化)。

3、提升网站权重(关键词和外链的建设)。

今天主要是分析下Google蜘蛛抓取一个页面时,对哪些内容会进行分析和提取,深入了解以后就可以对网站页面内容进行更有效的优化,对网站的排名能起到非常大的效果。

打开一个页面时,视觉看到的和蜘蛛看到的内容是不一样的。蜘蛛看到的是网站服务器发给浏览器的源代码,而这些源代码中蜘蛛会忽略很多内容如:HTML标签,和一些外部文件调用内容等。蜘蛛能看到的就是网页上的内容文本。如:

这是weiku.com 其中一个页面的源代码,我们能看到的很多HTML代码和JS调用,但是蜘蛛是忽略这些代码的,它只对页面的文字内容(即红线框起的那些内容)感兴趣。

所以代码代优化其中之一是:减少不必要的Html代码,减少布局的层级结构,CSS样式和JS尽量外部调用而不是直接写在页面上。这样可以减少很多冗余的垃圾代码,同时可以减少网页的下载内容提升响应速度。

除了内容外,搜索引擎还读取网站的几个元标签,如下图:

其中之一就是页面的标题标签即:<title>标题</title>,此标签是影响排名最重要的因素之一,同时也是用做搜索引擎排名结果中的标题。所以标题标签的优化及其中要,符合Google搜索引擎的标题最优优化是:

1、标题长度最好不要大于70个字母,最好在搜索结果的标题中能看完整句话。

2、标题中出现有关该页面的关键词,同时根据搜索引擎匹配关键词的原理,关键词最好出现在标题的开头。

3、标题最好是一句完整而又简洁的话,关键词用一到两个,不要出现明显的叠加关键词。

其二就是meta标签其中有:

关键词标签即:<meta name="keywords" content="" /> 这个标签主要是告诉搜索引擎本页面的主要关键词是什么,但是这个标签因为出现被滥用,所以这个标签对Google搜索引擎没有任何作用不影响排名,不优化也摆。不过作为一个SEOer,任何细节都不能错过,所以这个标签没作用,但还是要认真去填写。

描述标签即:<meta name="description" content=""/>这个标签也不影响排名,但它有着重要的意义,因为搜索引擎基本上(Google有些时候读取页面重要内容而不是该标签的内容)会把它用作搜索结果的说明。所以这个标签是获得点击量的非常重要的因素,该标签长度不要大于155个字母。

ROBOT标签即:<meta name="ROBOT NAME" content="ARGUMENTS" /> ,该标签主要是告诉搜索引擎页面的索引和跟踪的方式,该标签content 部份主要是有:noindex,nofollow,noarchive,noodp,noydir,nosnippet 征对这几个的用法将会写一篇文章单独分析,建议不要轻易用robot标签。

在第一张图的代码中,还看到一个

<img src="http://upload.南方网景//” title=“HP-mini hand bike pump" alt="HP-mini hand bike pump product picture" onload="DrawImage(this,122,122)" onerror="this.src='/images/Nopicture3.gif'"></a> 标签,这是个图片展示标签,该标签也是网站对图片优化的重要部份,因为搜索引擎目前识别图片的技术还不强,所以它不能知道图片里是什么内容。而只能通过图片周围的文字,img 标题的alt 属性来获取文字判断。所以对图片的优化主要是在 alt属性了图片周围的文字描术上。当然为了考虑图片有时候下载不了时得用一张默认图片代替,提升网站的用户体验。

搜索引擎还读取一个noscript标签,这个标签主要是为了防止有些内容是用JS加载进来的,而搜索引擎本身是不读取JS内容的,如果站长想让某些内容用JS调用,而当JS被禁用时展示另外一些内容,而这部份内容又想被搜索引所抓取的话,就可以用一个noscript标签。

在页代码优化上能影响搜索引擎对网站判断的还有还有些两个非常重要的HTML元素:<h1>keyword</h1>,<h2>keyword</h2>,<h3>keyword</h3>它们的重要程度依次递减。以及<b>keyword</b>,<strong>keyword</strong>。

以上就是搜索引擎对页面的一些元素和标签的读取和优化方法。在页面代码优化上还有不止这些,如页面内容的布局上,和设计上,其中两点就是:1、页面层级结构太深,2、页面代码布局不合理,有些重要的内容需要在页面顶端展示的网页美工因为技术因原而把代码写到了底部。

站内优化,页面优化需要注意的细节还有很多,很多时候一个标签一个小细节做好了就会带来意想不到的效果,而要是忽略了可能会给网站带来毁灭性的打击。所以做SEO一定要细心,耐心,写这篇文章主要也是提醒大家要做好网站的SEO优化首先确保页面优化已经到位了,不然所做的站外优化,内部结构的优化都很难见效。

咨询热线:020-85648757 85648755 85648616 0755-27912581 客服:020-85648756 0755-27912581 业务传真:020-32579052
广州市网景网络科技有限公司 Copyright◎2003-2008 Veelink.com. All Rights Reserved.
广州商务地址:广东省广州市黄埔大道中203号(海景园区)海景花园C栋501室
= 深圳商务地址:深圳市宝源路华丰宝源大厦606
研发中心:广东广州市天河软件园海景园区 粤ICP备05103322号 工商注册