Hauy`s blog

专注于用户体验、交互设计、web前端技术和web标准化建设。

网页的中文URL应该如何编码才能有利于SEO?

2008.02.26 - 10条评论 »

最近在关注SEO方面的技术,碰到了一个关于中文的URL编码方面的问题。

很多朋友表示百度无法识别经过utf-8编码后的url链接。
星箭认为,是百度故意不识别utf-8编码后的url链接
但是我注意到,这个现象应该是Google和Baidu对于编码后的url链接采用了不同的解码方式导致。

我们来看赶集网的热门标签页和土豆网的标签频道在搜索引擎中的表现:


先看
赶集网的,赶集网的url编码采用了gb2312的编码方式

这是百度下的搜索结果页

赶集网在百度下的搜索结果页

这是google下的搜索结果页面

赶集网在google下的搜索结果页

我们发现,baidu将赶集网的url编码转化为中文,而google则保留了原始链接。

再来看土豆网,土豆网采用了uft-8的url编码方式

这是在百度下的搜索结果页面

土豆网在百度下的搜索结果页面

这是在google下的搜索结果页面

土豆网在google下的搜索结果页面

土豆的url被百度解码以后变成了乱码,而在google下则能正确地还原为中文。

结论:

  1. google对url采用utf-8的解码方式,百度则采用gb2312的解码方式;
  2. 对于一个网站来说,如果从baidu过来的流量比较大,可以尝试使用gb2312的url编码方法;
  3. google能把纯中文的url转化为utf-8编码,而baidu则完全无法收录。

附:

推荐一个Encode/Decode工具:http://seohelper.cn/tools/urlencode


引用 (Trackbacks)

使用这个网址对这篇文章进行引用。


评论

订阅这篇文章评论的RSS聚合
  1. 思路很清洗,结论很实用,学习了 :)

    kyw - 四月 11, 2008 @8:03 下午
  2. “baidu则完全无法收录”?你确定?无法正确显示是对的,但至于是不是无法解析URL中的中文,我也很想知道。

    伍子欣 - 六月 24, 2008 @1:34 下午
  3. @伍子欣 确实是这个情况。
    看一下淘宝UED首页(http://ued.taobao.com/blog/)有这篇文章:《OpenSearch 初探》
    链接为:http://ued.taobao.com/blog/2008/06/18/opensearch-初探/
    google上的搜索结果:http://www.google.com/search?q=OpenSearch 初探&ie=utf-8&oe=utf-8&aq=t
    baidu上的搜索结果:
    http://www.baidu.com/s?wd=OpenSearch site:ued.taobao.com

    发现百度无法收录这个页面。

    hauy - 六月 26, 2008 @1:45 下午
  4. 技术都做到位了的话,收不收录就得看运气了

    seo服务 - 九月 27, 2008 @3:57 下午
  5. 找个大家常用的编码方式最保险

    seo公司 - 九月 27, 2008 @4:00 下午
  6. 个人感觉百度和Google只是不显示而已呃..应该都有权重的

    Yiwu - 一月 3, 2009 @11:30 下午
  7. billinn - 二月 2, 2009 @11:09 上午
  8. 中文url是个很头大的问题,如果老外访问呢?

    yiwu - 二月 20, 2009 @3:49 下午
  9. 乱码归乱码,百度还是收录的。

    盒子 - 三月 21, 2009 @6:12 上午
  10. 百度和Google都能收录,也能显示。百度的结果页面是GB的,所以解码后的URL显示乱码了,如果在浏览器菜单上选择UTF-8,乱码就变正文了。
    Google现在好像都能显示了。

    Yao - 九月 23, 2009 @2:15 下午

发表您的评论


(必填)
添加blog地址

搜索

输入关键词并按回车进行搜索

页面

文档


按月存档:

订阅

订阅博客文章

链接


我的 Google Reader 分享

同步



程序提供:WordPress 主题设计:Dalarnas

Hauy`s blog © 2010 — 保留部分权利