其实大家对robots.txt内容和写法都很清楚了,只是在应用的时候总是粗枝大叶。今天在阿尔丁SEO交流群里有个朋友问了一个关于robots写法的问题。问题大致如下:
      

我的网站中存在一些重复的动态页面,我不想让搜索引擎收录这些动态页面,这些页面的URL如下:
/subinseo=cart&a=add&spid=234
/subinseo1=cart&a=add&spid=235
/subinseo2=cart&a=add&spid=237
我想用robots屏蔽这些页面被搜索引擎蜘蛛抓取,应该怎么设置?


      这个问题其实很简单,首先我们来确定这些页面的目录,假如说他是根目录下的页面。并且我们发现这些页面具有一个共同点,就是在URL中有一段参数cart&a=add&spid是相同的。那么我们在写屏蔽语句的时候就可以使用通配符(*)来代替除了cart&a=add&spid以外的字符。
       Disallow: /*cart&a=add&spid*   禁止访问根目录下的所有带有参数cart&a=add&spid的页面。

*号在这里起到一个通配符的作用,她代替了任何的字符。robots.txt文件的写法大家应该更认真的阅读。

作者: 苏斌@西安SEO培训博客
版权属于:阿尔丁培训机构
版权所有。转载时必须以链接形式注明作者和原始出处及本声明。