点击这里给我发消息 点击这里给我发消息
首页 > 行业资讯 > IT风云>详细内容

如何应对百度不收录大量采集来的数据和网页呢

添加时间:2010-1-5
    相关阅读: 虚拟主机 网页 SEO 页面 数据库 链接 网站

各位新手:我们如何应对百度不收录大量采集来的数据和网页呢

1、采集完以后,手工增加一次数量的"原创性文章",为什么加引号呢。因为原创不好写。教大家一个简单的小办法用来骗蜘蛛,去找到相关类型的文章。。。。把标题改掉。把里面的段落格式打乱。如果你有兴趣,可以自己在里面写一段。就这样。一个"原创文章"就产生了。然后,让你"原创"的文章多在首页上出现几条。

2、外连方面。多找几个好点的链接。不要搞群发。。。。

3、坚持做。 坚持是作SEO的一种美德

4.没有外连或者极少,无法引导蜘蛛过来.

关于如何引导蜘蛛来检索你的网站,第二条里面有介绍了,多说一些。博客、网站链接、百度知道、软文......这里举一个最近的垃圾站例子:[www.yxpcw.com]只是在donews发了个软文然后找朋友加了个链接,一天就收录了。下一步就是更新,等引擎多收录几页,然后按我说的。过三两天就进入正式的优化过程。作优化不能心急实在不行的话,那你只能去百度提交了。作SEO的好像都不主张去主动提交。

5.没收录前经常修标网站标题或者关键字,或者大的版面格式,或者URL。这样搞的直接结果就是:蜘蛛搞不清楚你要干什么,搞晕了。网站标题可以说是一个网站的脸面,而你在没收录前就改来改去直接导致定位不准。还有URL的改变也是个很不好的现像。说不定你在改目录的时候蜘蛛已经检索到一次,而下次又来的时候找不到了....那肯定不能抓取了。那么看查看百度蜘蛛已经检索过一次了呢?百度收录任何面页都不是蜘蛛爬到就直接收录并显示出来的。大家可以注意一下IIS日志,新站上线后,第二三天的时候去看一下,打开日志文件,直接搜索"baiduspider" 如果能找到。****baiduspider。。。。get /robots。txt -80 -****这样的数据。那么恭喜你,你的页面百度蜘蛛已经
检索过了,一般情况下会保存进缓存数据库内,多数在两到三天内肯定会显示出来。

看到这一条之后,你要作的是什么?

更新网站。我说的更新绝不是改网站标题和关键字,而是增加文章。让蜘蛛下次来的时候能检索到新东西。很快你的站就能收录

6.网站主题是引擎屏蔽关键字或与法律想抵触。

这个嘛,作垃圾站的应该有不少遇到的。现在是"河蟹"社会。很多词最好不要去动,我也就不列举一些词了,以免影响了本贴的发布。

极少数是由于以下原因不收录

7.你新注册的域名,以前被引擎K过或者被惩罚过。那么怎么查看一个域名是否以前被屏蔽过或者惩罚过呢?
说实话。这个我也不好查,估计每天都有N多站被K,百度也不可能给你单独列个表出来说XX站被K了。但是我们可以查看这个域名以前是否被人用过。方法很简单:直接在引擎里打上你要注册的域名。比如www.yxpcw.com如果各大引擎都没有返回数据,那应该就是没用过的。

8.自认倒霉,你用的虚拟主机IP被屏蔽,或者你站受牵连服务器IP被屏蔽的情况极少出现。受牵连的说话比较多。有说大量垃圾站堆在一个服务器的,也有说跟大量垃圾站交换了链接的。这种情况我没有遇到过,不多作解释。

9.百度更新期间你的网站无法访问。

百度蜘蛛开始采数据的时间最频繁应该是晚上12点到早上6点。更新时间一般在早上8点到9点。这就是为什么很多人经常问。在大清早的时候网站有排名。到了下午排名就没了的原因。一定要确保在这个时间段内你的网站能访问,否则蜘蛛抓取不到数据是很危险D。一次两次可能不会造成排名影响。但是多了就很难说了。这里我还是感觉万网的空间比较好。稳定。贵点是贵点了。但是稳定。呵呵

基本就这么多了。再有其它情况,就是很少见的了。
再说一点。作SEO,作网站。贵在坚持。
虽然不能说坚持到底就肯定胜利,但是,引用马云的一句话:创业者最大的失败就是放弃!

咨询热线:020-85648757 85648755 85648616 0755-27912581 客服:020-85648756 0755-27912581 业务传真:020-32579052
广州市网景网络科技有限公司 Copyright◎2003-2008 Veelink.com. All Rights Reserved.
广州商务地址:广东省广州市黄埔大道中203号(海景园区)海景花园C栋501室
= 深圳商务地址:深圳市宝源路华丰宝源大厦606
研发中心:广东广州市天河软件园海景园区 粤ICP备05103322号 工商注册