最近有很多人都反应SITE结果不准,且在不同的GOOGLE域名后缀值也不一样,相差甚大。出现这种情况说明GOOGLE越来越不重视SITE这个功能了,SITE只是大致判断一个网站在GOOGLE的索引情况。而不代表真正索引多少,所以过分关注SITE或者收录多少是没有什么意义的。事实上SITE收录值也和排名没有什么关系,因为真正影响排名的是索引的数据量,而不是SITE或者是收录。
要了解这个首先从搜索引擎原理来讲,搜索引擎如GOOGLE它们通过爬虫也就就是蜘蛛爬行互连网上各个网站,在爬行的过程中把所爬取网站放在自己的数据库里,这一过程就是所谓的收录了。但是收录并不直接影响排名。因为收录的数据是海量,的巨大的,是杂乱无章的,如果GOOGLE要从收录数据库返回用户搜索的结果恐怕要好几天。事实上GOOGLE返回客户搜索结果只要零点几秒。可见GOOGLE返回客户的搜索结果不是从收录数据库读取的,而是从其索引数据库的读取的,而这个索引数据是,根据一个系列处理技术如分词等等,在收录数据数据库基础建立的,可以这么说收录多少是索引基础的,但收录了并不一定就会被添加到索引数据库,这就是为什么你通过SITE命令来查询一个网站收录值时和索引的值有很大的区别,在以前SITE的值常常远大于索引值,而现在则不一定,在GOOGLE主数据GOOGLE.COM这个值多半小于索引值,而在GOOGLE其它的域名后缀这个值常大于索引值或者根本没有返回结果。
要查看索引结果最好办法就是向是GOOGLE提交SITEMAP,GOOGLE在官方指南,GOOGLE BLOG及其帮助论坛都无一复加强调这个功能,甚至不厌其烦的教你如何制作SITEMAP,上传管理SITEMAP。足见SITEMAP功能的重要性。为什么会出现这种情况,我想大概是因为互连网上的网站太多了,蜘蛛爬的心累,它希望能有一个简单快捷的办法来了解互连网上的这些数据,以便给客户提供更的好搜索结果从而立于不败之地。
所以制作一个SITEMAP文件就尤为重要了,最好的制作办法就是通过自己写程序来实现,根据的不同目录,类别生成不同的SITEMAP文件,让搜索引擎能够更好的更简单的了解网站结构,索引更多数据,如果不能写程序实现可以下载目前网上比较流行的老虎SITEMAP生成器。但是如果地图文件太大了,蜘蛛爬的太累了它也就不想爬了,好象GOOGLE帮助论坛说如果SITEMAP.GZ文件超过10M的话所起作用就有限了,所以最好办法就是分门别类生成地图,这样既可以控制SITEMAP的大小,也可以知道那些目录或者类别的SITEMAP索引比例高。这样就可以根据索引比例高的SITEMAP,来调整索引比例低的网页结构从而达到优化整个网站结构的目的。 下篇预告英文SEO乱谈之流量跳出率转换率及着陆页优化(我BS把这些名词都用英文缩写的人,尽管我看英文基本达到和看中文一样流利)
1 个评论
634 次阅读