苏斌:搜索引擎是如何识别你网站使用什么语言的?
其实网站的SEO我们可以做的更细致,很多时候我们都是在考虑搜索引擎,研究搜索引擎的算法。回过头来想一想,你有想过你的访客吗?当一个中国人通过百度或者谷歌这两个搜索引擎搜到的时候,得到的搜索结果都是英文网站那该是多么头疼的一件事儿。
在阿尔丁群里,经常会有同学说,老师我的网站明明是中文网站,却为什么搜索引擎把我的网站识别为英文,甚至是阿尔拉伯文等等。那么今天苏斌就带领大家了解一下搜索引擎到底是如何识别网站的语言的。如果你的网站被识别错了语言,那么将在本地搜索中失去排名,甚至不被索引。这直接降低了搜索引擎营销的效果。

搜索引擎识别网页语言的几种考虑因素:
1、头部meta的字符集Content-Type标签
例如我们在查看阿尔丁论坛首页源代码的时候看到下面三行代码:
<html xmlns="http://www.w3.org/1999/xhtml"> <head> <meta http-equiv="Content-Type" content="text/html; charset=gbk" />
gbk属性值直接告诉搜索引擎阿尔丁论坛是中文网站,这在搜索引擎蜘蛛程序访问网站的时候很明确就判断出来了。当然也有很多人使用的开源程序,或者开发的网站采用的是utf-8的编码方式。那么如果采用了utf-8编码的网站,搜索引擎往往容易判断错误,不能很直观的确定他是什么语言的网站。是中文,还是英文,还是德文,还是瑞典语?
那么使用了utf-8编码的中文网站怎么办呢?在xml命名空间(xmlns)中设定中文因素,在上面代码第一句xmlns属性中添加lang="zh-CN"。告诉搜索引擎这是中文网站。
2、mata的语言Content-Language标签
<Meta http-equiv="Content-Language" Content="zh-CN">
这句代码直接告诉搜索引擎蜘蛛网页语言是中文,content-language 属性 是zh-cn。
3、通过网页内容来判断语言 通常情况下搜索引擎会根据网页内容来判断一个页面是什么语言,通过内容分析,分析字符集来判定语言。准确率往往很高,但是也不乏判断错误。因此meta标签的正确是使用方法就很重要了。
作者: 苏斌@西安SEO培训博客
版权属于:阿尔丁培训机构
版权所有。转载时必须以链接形式注明作者和原始出处及本声明。

这几种方法不错,曾经我做的网站也是这样。有时候被谷歌识别很正确,但是百度往往把我们的网站识别成英语。在页面语言识别上,感觉百度还是差的很远。
我们公司的技术总是还是用utf-8的编码方式,也许这个因素影响的吧。