« 虚度了四年的大学生活Google将允许出版商限定每日免费阅读文章数 »

动态网页与静态HTML的差别

目前Google在动态网页与静态HTML这个问题上已经基本完美解决。也就是说,现在对于Google,无论使用动态网页还是静态HTML,基本都能很好的抓取和收录,不会出现几年前那种带多个参数的动态URL就不抓取的现象。

然后,在目前的同等情况下,依然是静态HTML相对于动态网页针对搜索引擎更好,截止目前是这样,以后可能会有些改变,现在就不讨论。

相对于伪静态,对于目前的Google,也许动态的效果会更好一些,比如你要把这样一个URL地址:

http://www.domain.com/read.php?classid=123&lang=en&id=234

Rewrite成:

http://www.domain.com/read-234.html

效果理论来说反而不如上面的动态地址。

Google 管理员工具中增加了“像 Googlebot 一样抓取”功能,价值是非常大,因为我们可以直观的看到,Googlebot看到你的网页是什么样的。在Googlebot中对比了一下一个动态网页和手工生成的静态HTML,对比结果,能明显看到下面两个差别:

  • Last-Modified:静态HTML有修改时间(对于搜索引擎意味着可直接获取文件修改时间)
  • Content-Length:文件大小(文件大小对于搜索引擎的影响;Googlebot如果能从服务端直接获取文件大小,作为参考,抓取的效率会更高)

对比一下静态HTML与动态URL的工作方式:

  • 静态HTML:客户端与服务端通讯成功,服务端直接发送文件属性与内容。
  • 动态URL:客户端与服务器端通讯成功,服务端根据客户端请求的内容,产生页面内容,发送服务端信息与请求的内容。

使用动态URL:如果程序出现问题,所有基于些程序的内容将无法访问;如果模板变化,所有信息内容都会发生变化,而真正有价值的内容并没有改变;如果数据库ID不是唯一,新增的内容沿用了被删除内容的ID,将出现URL没有改变而页面完全变化……

但如果是静态HTML,文件只有“存在&不存在”(服务端状态不计算在内),“修改&未修改”(读Last-Modified就好了)。

总之:静态HTML具有更高的稳定性。

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

日历

最新评论及回复

最近发表

Powered By Z-Blog 1.8 Walle Build 100427

Copyright © 2009 - 2010 A小可 All rights reserved. E-mail:gcl@139.com
[苏ICP备09028164号]Gain More Traffic with SiteBro