复制内容,Google如何处理你的首页?

不同的网站首页,或者网站域名,会导致复制内容。例如,

如果都是可以访问的页面,那么他们都可能是你网站首页的复制内容。

实际上针对“首选域名”是否加“www”,google的网站管理工具已经提供了地方让你设置,你可以清楚的表达你的首选是www.semangle.com还是semangle.com。

而首页并不等同于域名,它只是一个有代表性的页面,至于访问你的域名后具体要打开什么页面,这通常是由服务器设定,比如IIS中的“默认首页”设置。

默认的首页名是可变的,例如东芝的日本站,它的index.htm被单独列出在搜索结果中,这是因为如果你从域名http://www.toshiba.co.jp/访问进入会指向index_j3.htm这个flash版的页面。这种结果说明,index.htm .html .asp .jsp .php….页面完全可以不是主页,这只取决于你的服务器设置。你一样可以让你的首页叫about-us.html。

那么,如果你同时存在多个首页文件,他们的内容完全一致,google如何处理它呢?

这是一个相对的问题,如果你去site一个这类网站,你会发现google的处理方式是展示域名,“省略”掉重复的页面(index.html等),你可以在“将省略的结果纳入搜索范围后再重新搜索”后查看到它们。

只是一种猜测,因为这其中涉及到“当首页权重可能超过域名”的特殊情况,未凡没有这方面经验。

但是如果你去搜索某个针对这个网站的关键字,结果就会变得不同。

例如我们搜索“Discuz 官方论坛”

搜索结果

但是,如果你去搜索“17DST 第三方交流论坛”

图片来自搜索引擎营销视角

不同的搜索,导致不同的结果,一个以index.php页面出现,一个以域名出现。index.php的页面pr为4 而域名pr为5,这就是复制内容

应该理智的对待复制内容,实际上,对它的担心并不是来自于google对复制内容的态度,我们可以抛开它,这是网站自家的事情,而不是侵犯某人的版权。

令人担忧的是来自内部或外部的混乱的链接方式,所有链接流入的权重,被分散到了域名,和首页,在参与排名竞争的时候,拳头的力量被分散成手指。在seo中,没有什么比这更令人沮丧。

所以,学习301重定向,变得重要。这里不罗列什么是301,如何进行301重新定向。那些内容超出了讨论范畴。

Post a Comment

Your email is never published nor shared. Required fields are marked *