Menu
帮助中心

帮助中心

专注网站建设12年,已为2600家公司提供网站建设
您当前所在位置:首页 > > 信息中心 > 帮助中心

搜索引擎指南robots.txt文件

有一种力量其实一直在渗入大量的网站和页面,我们通常看不到它们,而且它们通常也很蛮横,大部分人甚至不知道它的存在,大家不要误会,其实我说得是搜索引擎爬虫和机器人。每天,上百个这样的爬虫会出来对网站进行快速的搜索。不管是不是google打算对整个网络进行索引,还是spam机器人打算收集大量的 email地址,通常它们这样的寻找是漫无目的的。作为网站拥有者,我们可以通过一个叫做robots.txt的文件来控制哪些动作是机器人可以做的。

  创建robots.txt文件

  好,现在我们开始行动。创建一个叫robots.txt的文本文件,请确保它的文件名是正确的。该文件必须上传到在您的网站的根目录下,而不是二级目录下(例如,应该是http://www.mysite.com,而不是http: //www.mysite.com/stuff),只有满足以上两点,即文件名正确和路径正确,搜索引擎才会根据该文件中的规则工作,否则 robots.txt仅仅只是个常规文件而已,没有任何作用。

  现在,你已经知道如果这个文件该如何命名,以及应该把它上传在何处,接下来你会学习在这个文件中键入命令,搜索引擎会遵循一个叫做“机器人排除协议”(Robots Exclusion Protocol)的协议。其实,它的格式很简单,并且能够满足大多数的控制需要。首先是一行USERAGENT用来识别爬虫类型,紧跟着的是一行或者多行DISALLOW,这些行是用来限制爬虫访问网站的一些部分的。

  1) robots.txt基本设置

  User-agent: *

  Disallow: /根据以上的声明,所有的爬虫(这里用*表示出来)均不允许对您的网站的任何部分进行索引,这里的/表示所有页面。通常情况下这不是我们需要的,但这里仅仅是让大家有个概念而已。

  2) 现在让我们做一些小小的改动。尽管每个站长都喜欢Google,但是你可能不希望Google的镜像机器人挖掘你的网站,也不希望它把你的网站的镜像放在网上,实现在线搜索,如果仅仅是为了节省你的网站所在的服务器的带宽,下面的声明可以做到这一点

  User-agent: Googlebot-Image

  Disallow: /3) 以下代码不允许任何一个搜索引擎和机器人挖掘目录和页面信息

  User-agent: *

  Disallow: /cgi-bin/

  Disallow: /privatedir/

  Disallow: /tutorials/blank.htm4) 你还可以对多个机器人设置不同的目标,看看下面的代码

  User-agent: *

  Disallow: /

  User-agent: Googlebot

  Disallow: /cgi-bin/

  Disallow: /privatedir/这个设置很有趣,这里我们禁止了所有的搜索引擎对于我们的网站的挖掘操作,除了google,在这里Google被允许访问除了/cgi-bin/和/privatedir/以外的所有站点。这里说明,规则是可以定制的,但不是继承而来的。

  3) 有另外一种使用Disallow的方法:即允许访问网站所有内容,其实只要冒号后不输入任何东西就可以了

  User-agent: *

  Disallow: /

  User-agent: ia_archiver

  Disallow:在这里,除了alex以外的所有爬虫都不允许搜索我们的网站

  4) 最后,一些爬虫现在支持Allow规则,最著名的就是Google。正如这个规则的名字所说,"Allow:"允许你精确的控制那些文件或者文件夹是可以被访问的。然而,这个文件目前还不是robots.txt协议的组成部分,所以我建议只有在必须使用时才使用它,因为一些不够聪明的爬虫可能认为它是错误的。

  下面的内容来自于Google's的FAQs for webmasters,如果你希望除了Google以外的爬虫都不挖掘你的网站,那么以下的代码是做好的选择

  User-agent: *

  Disallow: /

  User-agent: Googlebot

  Allow: /

相关阅读

汇总搜索引擎网站的免费提…

帮助中心 2009-11-15
1,Google免费网站提交入口http://www.google.com/addurl/2,百度免费网站提交入口http://www.baidu.com/se…阅读新闻

网站建设分为几个步骤?

帮助中心 2009-11-01
1.域名注册域名,是互联网上的一个企业或机构的名字,是在互联网上企业间相互联络的网络地址。一个企业如…阅读新闻

网站能干什么?

帮助中心 2009-11-01
例如一个企业在互联网上发布公司简介、新产品信息、产品说明、宣传公司服务、招聘人才等多方面信息。不仅可…阅读新闻

谷歌关闭三个工程办公室 全…

帮助中心 2009-11-01
谷歌周三表示,该公司将关闭三个工程办公室,并在全球范围内裁减约100名员工。据国外媒体报道,谷歌人力资源…阅读新闻

重庆网站制作对企业的帮助…

帮助中心 2023-03-27
作为现代企业的重要组成部分,网站对企业的帮助可以从多个角度进行深度分析:1.品牌形象塑造:网站是企业对…阅读新闻

建设一个网站需要多久

帮助中心 2022-10-17
建设一个网站到底需要多长时间?这要看你的网站具体的功能,要求。根据工作量来确定时间的,一般企业网站功…阅读新闻
返回全部新闻

最新发布

重庆网站制作对企业的帮助…

帮助中心 2023-03-27
作为现代企业的重要组成部分,网站对企业的帮助可以从多个角度进行深度分析:1.品牌形象塑造:网站是企业对…阅读新闻

传统行业如何把握ai人工智…

行业新闻 2023-03-27
传统行业可以通过以下几个步骤来把握AI人工智能的崛起:1.研究AI技术原理和应用场景:了解AI技术的基本原理…阅读新闻

AI人工智能对网站建设行业…

行业新闻 2023-03-27
人工智能(AI)对网站建设行业的影响越来越显著,它可以在自动化方面提供更高效、更准确的解决方案,同时也…阅读新闻

签约重庆韶恒科技有限公司…

公司新闻 2023-03-27
沛宣网络签约重庆韶恒科技有限公司营销型网站建设项目。网站定位:品牌营销型网站建设;企业宣传型网站建设…阅读新闻

福莱雅暖通设备有限公司官…

公司新闻 2023-03-27
热烈祝贺河南省福莱雅暖通设备有限公司官方网站正式上线!网站定位为:全网营销型网站建设。网站首页预览:…阅读新闻

祝贺重庆视吉通信工程有限…

公司新闻 2023-03-27
由沛宣网络公司设计开发制作的“重庆视吉通信工程有限公司”官方网站于2023年1月2日正式上线!网站首页预览…阅读新闻

建设一个网站需要多久

帮助中心 2022-10-17
建设一个网站到底需要多长时间?这要看你的网站具体的功能,要求。根据工作量来确定时间的,一般企业网站功…阅读新闻

签约重庆立平物联网科技公…

公司新闻 2022-10-17
公司签约重庆立平物联网科技公司品牌营销型网站建设。网站类型:品牌网站建设、公司营销型网站建设开发周期…阅读新闻

定制型网站到底有哪些好处…

新闻动态 2022-07-18
沛宣网络专注15年网站建设行业,主要以定制型的企业网站;高端网站建设,为客户制作有价值网站。定制网站是…阅读新闻

如何让你的网页设计更漂亮…

帮助中心 2022-07-18
什么样的网页设计能点亮你的眼睛?对你来说,什么是不可思议的网页设计项目?如果你的作品是现代的,简单易用…阅读新闻

网站如何通过设计来保持网…

网站建设中心 2022-07-18
网站设计系统稳定器不是一个框检查或组件建立。相反,它们是对系统的信任和尊重的衡量标准,它们是通过你与…阅读新闻

签约图源建筑设计公司官方…

公司新闻 2022-07-18
沛宣网络签约图源建筑设计公司网站设计与制作。网站定位为:品牌型网站建设;企业宣传型网站建设;H5响应式…阅读新闻
返回全部新闻
友情链接:
  • 企业网站建设
  • 营销型网站建设
  • 手机网站建设
  • 模板网站建设
  • H5网站建设
  • 网站改版升级
  • 重庆网站建设
  • 模板网站建设
  • 公司简介
  • 成功案例
  • 解决方案
  • 新闻中心
  • 联系我们
  • 网站地图
  • XML
  • 万州网站建设
  • 江津网站建设
  • 永川网站建设
  • 合川网站建设
  • 北碚网站建设
  • 黔江网站建设
  • 涪陵网站建设
  • 南川网站建设
  • 铜梁网站建设
  • 璧山网站建设
  • 大足网站建设
  • 綦江网站建设
  • 长寿网站建设
  • 开州网站建设
  • 潼南网站建设
  • 武隆网站建设
  • 奉节网站建设
  • 荣昌网站建设
  • 梁平网站建设
  • 城口网站建设
  • 云阳网站建设
  • 巫山网站建设
  • 丰都网站建设
  • 垫江网站建设
  • 秀山网站建设
  • 酉阳网站建设
  • 忠县网站建设
  • 石柱网站建设
  • 彭水网站建设
  • 巫溪网站建设
  • 万盛网站建设
  • 巴南网站建设
  • 江北网站建设
  • 南坪网站建设
  • 九龙坡网站建设
  • 沙坪坝网站建设
  • 大渡口网站建设
  • 毕节网站建设
  • 安顺网站建设
  • 六盘水网站建设
  • 铜仁网站建设
  • 黔东南网站建设
  • 黔南网站建设
  • 黔西南网站建设
  • 遵义网站建设
  • 昆明网站建设
  • 曲靖网站建设
  • 昭通网站建设
  • 绵阳网站建设
  • 自贡网站建设
  • 攀枝花网站建设
  • 玉溪网站建设
  • 保山网站建设
  • 丽江网站建设
  • 临沧网站建设
  • 大理网站建设
  • 普洱网站建设
  • 拉萨网站建设
  • 日喀则网站建设
  • 昌都网站建设
  • 林芝网站建设
  • 山南网站建设
  • 那曲网站建设
  • 阿里网站建设
  • 宝鸡网站建设
  • 汉中网站建设
  • 铜川网站建设
  • 咸阳网站建设
  • 渭南网站建设
  • 安康网站建设
  • 延安网站建设
  • 商洛网站建设
  • 榆林网站建设
  • Copyright © 2008-2018 沛宣网络 渝ICP备13000588号-5 工商备:500108000067794 渝公网安备 50010802002673号

    扫描二维码添加微信:沛宣网络
    确 认