要知道在seo优化的过程当中,有时候是需要对搜索引擎蜘蛛进行屏蔽的,就是禁止对网站的某个地方进行抓取,那么我们应该如何屏蔽搜索引擎蜘蛛呢?下面我们一起来看一看具体的操作方法。网站建设★网站设计★网站制作★网页设计-599元全包;企业网络推广☆网站优化☆seo☆关键词排名☆百度快照-2200元全年展示;做网站优化排名-网站建设公司
百度蜘蛛抓取我们的网站,希望我们的网页能被包含在它的搜索引擎中。将来,当用户搜索时,它会给我们带来一定量的搜索引擎优化流量。当然,我们不想让搜索引擎抓取所有东西。
因此,此时我们只希望能够抓取搜索引擎搜索到的内容。例如,用户的隐私和背景信息不希望搜索引擎被捕获和包含。解决这些问题有两种最佳方法,如下所示:
robots协议文件屏蔽百度蜘蛛抓取
robots协议是放在网站根目录下的协议文件,可以通过网址访问,当百度蜘蛛抓取我们的网站时,它会先访问这个文件。因为它告诉蜘蛛哪些能抓,哪些不能。
robots协议文件的设置比较简单,可以通过User-Agent、Disallow、Allow这三个参数进行设置。
User-Agent:对不同搜索引擎的声明;
Disallow:不允许抓取的目录或页面;
Allow:被允许抓取的目录或页面通常可以省略或不写,因为如果你不写任何不能抓取的东西,它就可以被抓取。
下面我们来看一个示例,场景是我不希望百度抓取我网站所有的css文件,data目录、seo-tag.html页面
User-Agent:BaidusppiderDisallow:/*.cssDisallow:/data/Disallow:/seo/seo-tag.html
如上所述,user-agent声明了蜘蛛的名称,这意味着它针对的是百度蜘蛛。以下内容无法获取"/*。css",首先/指的是根目录,这是您的域名。*是代表任何内容的通配符。这意味着无法抓取以.css结尾的所有文件。这是你自己的两个经历。逻辑是一样的。
通过403状态码,限制内容输出,屏蔽蜘蛛抓取。
403状态代码是http协议中的网页返回状态代码。当搜索引擎遇到403状态代码时,它知道这些页面受权限限制。我无法访问它。例如,如果您需要登录才能查看内容,搜索引擎本身将无法登录。如果您返回403,他也知道这是权限设置页面,无法读取内容。当然,它不会被包括在内。
返回403状态代码时,应该有一个类似于404页面的页面。提示用户或蜘蛛执行他们想要访问的内容。两者都是不可或缺的。您只有提示页面,状态代码返回200,这是百度蜘蛛的大量重复页面。有403个状态代码但返回不同的内容。这也不是很友好。
最后,对于机器人协议,我想补充一点:“现在,搜索引擎将通过网页的布局和布局来识别网页的用户友好性。如果阻止css文件和js文件相关到布局,然后搜索引擎我不知道你的网页布局是好是坏。因此不建议阻止这些内容来自蜘蛛。
猜你喜欢
联络方式:
电话:181-0734-0881
邮箱:1713521713@qq.com
-
短视频SEO排名,抖音搜索SEO
抖音搜索SEO排名算法是什么?很多人在做抖音搜索SEO排名时,对抖音搜索SEO排名算法了解不多,导致操作过程中关键词优化效果不是很好 一、抖音SEO搜索算法是什么。 抖音搜索SEO...
-
什么是本地区关键词全国性关键词?
地区性关键词:是指关键词中带有地区名称,如:关键词为“衡阳网站建设公司”,该词为地区性关键词,因为关键词中出现了地区名称“衡阳”。全国性关键词:是指关键...
-
网站建设要花多少钱?做一个网站要多少钱?
网站建设要花多少钱?传统的网站建设模式下,门槛太高,不是每个人都能做到的。很多企业对市场不了解,到外面找人建站很容易吃亏。实际上只要掌握了一些基本知识,就会知道建网站建设...
-
刷屏朋友圈的“跳一跳” 小程序究竟有多火热?
这两天想必大家在刷朋友圈时都看到了一款名为“跳一跳”的游戏,2017年12月28日,微信通过旗下多个公众号宣布上线“小游戏”,目前,iOS和安卓的用户,只需升级...
-
百度惊雷算法首推,快排行业将退出SEO江湖
近几年,百度在保障用户体验提升内容生态良性发展方面下了很多功夫,从打击外链、采集、站群、页面友好度等方面都经过了多次的算法调整,例如:青藤算法、绿萝算法、飓风算法、清风...