网页的中文URL应该如何编码才能有利于SEO?
2008.02.26 - 10条评论 »
最近在关注SEO方面的技术,碰到了一个关于中文的URL编码方面的问题。
很多朋友表示百度无法识别经过utf-8编码后的url链接。
星箭认为,是百度故意不识别utf-8编码后的url链接。
但是我注意到,这个现象应该是Google和Baidu对于编码后的url链接采用了不同的解码方式导致。
我们来看赶集网的热门标签页和土豆网的标签频道在搜索引擎中的表现:
先看赶集网的,赶集网的url编码采用了gb2312的编码方式
这是百度下的搜索结果页

这是google下的搜索结果页面

我们发现,baidu将赶集网的url编码转化为中文,而google则保留了原始链接。
再来看土豆网,土豆网采用了uft-8的url编码方式
这是在百度下的搜索结果页面

这是在google下的搜索结果页面

土豆的url被百度解码以后变成了乱码,而在google下则能正确地还原为中文。
结论:
- google对url采用utf-8的解码方式,百度则采用gb2312的解码方式;
- 对于一个网站来说,如果从baidu过来的流量比较大,可以尝试使用gb2312的url编码方法;
- google能把纯中文的url转化为utf-8编码,而baidu则完全无法收录。
附:
推荐一个Encode/Decode工具:http://seohelper.cn/tools/urlencode

评论
思路很清洗,结论很实用,学习了
“baidu则完全无法收录”?你确定?无法正确显示是对的,但至于是不是无法解析URL中的中文,我也很想知道。
@伍子欣 确实是这个情况。
看一下淘宝UED首页(http://ued.taobao.com/blog/)有这篇文章:《OpenSearch 初探》
链接为:http://ued.taobao.com/blog/2008/06/18/opensearch-初探/
google上的搜索结果:http://www.google.com/search?q=OpenSearch 初探&ie=utf-8&oe=utf-8&aq=t
baidu上的搜索结果:
http://www.baidu.com/s?wd=OpenSearch site:ued.taobao.com
发现百度无法收录这个页面。
技术都做到位了的话,收不收录就得看运气了
找个大家常用的编码方式最保险
个人感觉百度和Google只是不显示而已呃..应该都有权重的
求教:
下面是两个百度收录快照的地址,出自一个网站,utf-8的编码,采用中文url。为什么收录结果。一个中文链接是乱码,另一个不是乱码? 求高手指教!!
http://cache.baidu.com/c?m=9f65cb4a8c8507ed4fece763105392230e54f73f6b92914f3888d81384642c101b7bbfec62630d4680902b7a52ef0f07bbae616f765473f7ca929f4aaae8d36a38895377374bc60a05d26fb8bc4232cb518750e2b86ee3adfa4684dda4c4a85044c125120983e7fc5c1764ba78801025a6fbd91e1a0347ffac&p=9a60ca1385cc46fd0ebd9b790c08&user=baidu
http://cache.baidu.com/c?m=9d78d513d99f16ea19f9d33e53198d205f1697624fcacd503a918448e4380c04063ca4e76c790704a494207a5df80c1df7b06121691420c1cc89ce199bec852859d470713101913062c469aedc3025d657974d99ac0e94bbe74494b9a3a7c82456dd237167&p=c349c64ad09114f918bd9b7e0b52&user=baidu
中文url是个很头大的问题,如果老外访问呢?
乱码归乱码,百度还是收录的。
百度和Google都能收录,也能显示。百度的结果页面是GB的,所以解码后的URL显示乱码了,如果在浏览器菜单上选择UTF-8,乱码就变正文了。
Google现在好像都能显示了。
发表您的评论