robots怎么写

1. 请教robots怎么写呀

"robots.txt"文件包含一条或更多的记录,这些记录通过空行分开(以CR,CR/NL, or NL作为结束符),每一条记录的格式如下所示: ":"。

在该文件中可以使用#进行注解,具体使用方法和UNIX中的惯例一样。该文件中的记录通常以一行或多行User-agent开始,后面加上若干Disallow行,详细情况如下: User-agent: 该项的值用于描述搜索引擎robot的名字,在"robots.txt"文件中,如果有多条User-agent记录说明有多个robot会受到该协议的限制,对该文件来说,至少要有一条User-agent记录。

如果该项的值设为*,则该协议对任何机器人均有效,在"robots.txt"文件中,"User-agent:*"这样的记录只能有一条。 Disallow: 该项的值用于描述不希望被访问到的一个URL,这个URL可以是一条完整的路径,也可以是部分的,任何以Disallow开头的URL均不会被robot访问到。

例如"Disallow:/help"对/help.html 和/help/index.html都不允许搜索引擎访问,而"Disallow:/help/"则允许robot访问/help.html,而不能访问/help/index.html。任何一条Disallow记录为空,说明该网站的所有部分都允许被访问,在"/robots.txt"文件中,至少要有一条Disallow记录。

如果"/robots.txt"是一个空文件,则对于所有的搜索引擎robot,该网站都是开放的。 Allow: 该项的值用于描述希望被访问的一组URL,与Disallow项相似,这个值可以是一条完整的路径,也可以是路径的前缀,以Allow项的值开头的URL是允许robot访问的。

例如"Allow:/hibaidu"允许robot访问/hibaidu.htm、/hibaiducom.html、/hibaidu/com.html。一个网站的所有URL默认是Allow的,所以Allow通常与Disallow搭配使用,实现允许访问一部分网页同时禁止访问其它所有URL的功能。

需要特别注意的是Disallow与Allow行的顺序是有意义的,robot会根据第一个匹配成功的Allow或Disallow行确定是否访问某个URL。 使用"*"和"$": robots支持使用通配符"*"和"$"来模糊匹配url: "$" 匹配行结束符。

"*" 匹配0或多个任意字符。

2. 网站的robots怎么写啊,请高手指点

合理的设置网站的robots对网站的优化有很大的帮助。我们需要创建一个robots.txt文件,然后上传到网站的根目录就可以了。网站robots.txt的内容格式如下:

User-agent:(蜘蛛名字)

Disallow: (文件名字)

或者

User-agent:(蜘蛛名字)

Allow: (文件名)

Disallow: (文件名)

User-agent:定位搜索引擎的命令

给你举个例子,如果你想屏蔽百度蜘蛛抓取你的admin文件,你可以这样写

User-agent: Baiduspider

Disallow: /admin

如果你想了解更多的关于robots.txt文件的书写方法,你可以参考我的博客里面写的,里面都有实例分析参考资料:

3. robots.txt文件怎么写

举一个简单的例子:当一个搜索蜘蛛访问一个站点时,它会首先检查该站点根目录下是否存robots.txt,如果存在,搜索机器人就会按照该文件中的内容来确定访问的范围;如果该文件不存在,所有的搜索蜘蛛将能够访问网站上所有没有被口令保护的页面。

常见的蜘蛛识别:google蜘蛛(Googlebot)、baidu蜘蛛(Baiduspider)、bing蜘蛛(MSNbot)、sousou蜘蛛(sosospider)robots.txt文件的写法User-agent: * 这里的*代表的所有的搜索引擎种类,*是一个通配符Disallow: /admin/ 这里定义是禁止爬寻admin目录下面的目录Disallow: /require/ 这里定义是禁止爬寻require目录下面的目录Disallow: /ABC/ 这里定义是禁止爬寻ABC目录下面的目录Disallow: /cgi-bin/*.htm 禁止访问/cgi-bin/目录下的所有以”.htm”为后缀的URL(包含子目录)。

4. 怎样写robots文件

robots.txt文件的格式User-agent: 定义搜索引擎的类型Disallow: 定义禁止搜索引擎收录的地址Allow: 定义允许搜索引擎收录的地址我们常用的搜索引擎类型有:google蜘蛛:googlebot百度蜘蛛:baiduspideryahoo蜘蛛:slurpalexa蜘蛛:ia_archivermsn蜘蛛:msnbotaltavista蜘蛛:scooterlycos蜘蛛:lycos_spider_(t-rex)alltheweb蜘蛛:fast-webcrawlerinktomi蜘蛛: slurprobots.txt文件的写法User-agent: * 这里的*代表的所有的搜索引擎种类,*是一个通配符Disallow: /admin/ 这里定义是禁止爬寻admin目录下面的目录Disallow: /require/ 这里定义是禁止爬寻require目录下面的目录Disallow: /require/ 这里定义是禁止爬寻require目录下面的目录Disallow: /ABC 这里定义是禁止爬寻ABC整个目录Disallow: /cgi-bin/*.htm 禁止访问/cgi-bin/目录下的所有以".htm"为后缀的URL(包含子目录)。

Disallow: /*?* 禁止访问网站中所有的动态页面Disallow: .jpg$ 禁止抓取网页所有的.jpg格式的图片Disallow:/ab/adc.html 禁止爬去ab文件夹下面的adc.html所有文件User-agent: * 这里的*代表的所有的搜索引擎种类,*是一个通配符Allow: /cgi-bin/ 这里定义是允许爬寻cgi-bin目录下面的目录Allow: /tmp 这里定义是允许爬寻tmp的整个目录Allow: .htm$ 仅允许访问以".htm"为后缀的URL。Allow: .gif$ 允许抓取网页和gif格式图片robots.txt文件用法举例例1. 禁止所有搜索引擎访问网站的任何部分User-agent: *Disallow: /实例分析:淘宝网的 Robots.txt文件User-agent: BaiduspiderDisallow: /很显然淘宝不允许百度的机器人访问其网站下其所有的目录。

5. 请教关于robots写法的一些

robots.txt文件的写法 User-agent: * 这里的*代表的所有的搜索引擎种类,*是一个通配符 Disallow: /admin/ 这里定义是禁止爬寻admin目录下面的目录 Disallow: /require/ 这里定义是禁止爬寻require目录下面的目录 Disallow: /ABC/ 这里定义是禁止爬寻ABC目录下面的目录 Disallow: /cgi-bin/*.htm 禁止访问/cgi-bin/目录下的所有以".htm"为后缀的URL(包含子目录)。

Disallow: /*?* 禁止访问网站中所有的动态页面 Disallow: /.jpg$ 禁止抓取网页所有的.jpg格式的图片 Disallow:/ab/adc.html 禁止爬取ab文件夹下面的adc.html文件。 Allow: /cgi-bin/ 这里定义是允许爬寻cgi-bin目录下面的目录 Allow: /tmp 这里定义是允许爬寻tmp的整个目录 Allow: .htm$ 仅允许访问以".htm"为后缀的URL。

Allow: .gif$ 允许抓取网页和gif格式图片。

6. 一般门户网站的robots文件怎么写

使用Wordpress搭建的博客,利用robots.txt文件限制搜索引擎抓取部分目录及文件,归纳大致有以下几种方法。

最简单的开放写法不作任何限制,Wordpress站内链接结构比较合理,作为一般博客,完全开放就可以了,代码:User-agent: *Disallow:允许所有蜘蛛访问,允许访问所有内容。Wordpress只要模板中链接设计合理,没有需要限制的特殊内容,推荐使用这种写法。

最简单的严格写法User-agent: *Disallow: /wp-*#Allow: /wp-content/uploads/Disallow: /*.php$Disallow: /*.inc$Disallow: /*.js$Disallow: /*.css$Disallow: /?s=允许所有蜘蛛访问,限制以“wp-”开头的目录及文件,限制抓取.php文件、.inc文件、.js文件、.css文件,限制抓取搜索结果。Disallow: /wp-* 会连同附件目录一起限制抓取,如果想让搜索引擎抓取附件中的内容,将第三行的 # 号注释去掉。

Allow 不是所有搜索引擎都支持。最合理的写法卖瓜的都说自己瓜甜,我也觉得自己的Robots.txt写的最合理 User-agent: *Disallow: /wp-adminDisallow: /wp-content/pluginsDisallow: /wp-content/themesDisallow: /wp-includesDisallow: /?s=Sitemap: /sitemap.xml允许所有搜索引擎抓取,逐一列举需要限制的目录,限制抓取搜索结果。

包含sitemap.xml地址(这一项viki中有专门的说明,但Google管理员工具会提示‘检测到无效的 Sitemap 引用’,有效性尚有争议)。robots.txt其他写法为避免在搜索引擎中出现重复页面,Wordpress玩家自创了很多robots写法,列举一些常用的,作为参考(适用于伪静态方式的永久链接):Disallow: /page/#限制抓取Wordpress分页Disallow: /category/*/page/*#限制抓取分类的分页Disallow: /tag/#限制抓取标签页面Disallow: */trackback/#限制抓取Trackback内容Disallow: /category/*#限制抓取所有分类列表最后,推荐使用 Google管理员工具,登录后访问“工具 -> 分析 robots.txt”,检查文件有效性。

robots怎么写

转载请注明出处育才学习网 » robots怎么写

知识

怎么写学校歌

阅读(321)

本文主要为您介绍怎么写学校歌,内容包括怎么写校园歌曲,谁能帮我写一首校园歌曲,如何写出完美的校园歌曲歌词。并肩烙印友情,记忆深藏凝望,夕阳抹去最后一缕霞光,校园的小路上抹不去音符的快乐和旋律的悠扬。2、马尾梳起阳光,短发飞扬渴望,绿荫

知识

it个人职业目标怎么写

阅读(209)

本文主要为您介绍it个人职业目标怎么写,内容包括职业目标怎么写,职业目标怎么写,计算机系职业目标怎么写举个列子。在 校园招聘 中我们提交的简历里有一个职业目标,职业目标是简历投递者的工作发展方向,以及事业追求目标。让不少应聘者绞尽脑

知识

感激的英语怎么写

阅读(180)

本文主要为您介绍感激的英语怎么写,内容包括感激用英语怎么写,感激用英语怎么说,感激的英语怎样说。即便是从未学过英语的人,也一定知道thank you是什么意思。不过,有关于“谢谢”的英语你是不是只会说这一句呢?OK,还有Thanks

知识

田字格干字怎么写

阅读(1381)

本文主要为您介绍田字格干字怎么写,内容包括“干”在田字格中怎么写,干字田字格和笔画顺序,操字在田字格中的书写格式。

知识

微信怎么写位置

阅读(179)

本文主要为您介绍微信怎么写位置,内容包括怎么在微信朋友圈里随意更改位置,微信朋友圈创建位置时怎么写,微信如何编辑地理位置。分步阅读发微信朋友圈可以附带上自己的所在位置,但是怎么修改微信默认定位的地理位置呢,下面我就教大家方法。工

知识

手机怎么写java代码

阅读(211)

本文主要为您介绍手机怎么写java代码,内容包括一段写好的Java代码怎么放到手机里用,我想在手机上写一些java代码,不知道需要什么软件,如何用Java写一个手机界面的代码。import java.awt.dimension; import java.awt.toolkit; import java.a

知识

行书向怎么写

阅读(183)

本文主要为您介绍行书向怎么写,内容包括行书同怎么写,行书的为字怎么写,如何写好行书,本人的楷书已经能写好了,写行书有什么方法。行书技法 行书兼具楷书、草书的特点,但又绝非写好楷书便一定能写出一手漂亮 的行书字来,行书作为一种独立的书

知识

退伍鉴定怎么写

阅读(331)

本文主要为您介绍退伍鉴定怎么写,内容包括退役士兵鉴定表现实表现如何填写,退伍军人怎么写自我评价,亲们请问退伍军人自我鉴定怎么写求范文。政治思想:积极参加政治理论学习,思想比较稳定,能够认真学习政治教育,课后注意复习并写心得体会,把课堂

知识

童草书怎么写

阅读(233)

本文主要为您介绍童草书怎么写,内容包括童字草书怎么写,童字草书怎么写,童字用行书怎么写求图。童姥 田英章楷书写法:

知识

如果繁体字怎么写

阅读(179)

本文主要为您介绍如果繁体字怎么写,内容包括如果繁体字怎么写,人的繁体字怎么写,只是繁体字怎么写。自己尝试吧 在Windows XP中预置了“微软拼音输入法3.0”,使用它可以进行繁体字输入。请按以下步骤操作: (一)如果在输入法里没

知识

十一的日语怎么写

阅读(266)

本文主要为您介绍十一的日语怎么写,内容包括日语怎么说11个怎么说,日文数字“十一”怎么说,11时日语怎么写。1,いち 2、に 3、さん 4,し、よん 5、ご 6、ろく 7、しち、なな 8.はち 9、きゅう 10、じゅう

知识

去世后怎么写

阅读(211)

本文主要为您介绍去世后怎么写,内容包括去世的人怎么写,亲人去世怎样写说说,著名作家藏克家在鲁迅先生去世后,曾写什么文章。原发布者:李鹏亚对亲人去世的心情说说【篇一:对亲人去世的心情说说】人突然去世的心情说说其实死亡并不可怕,可怕旳

知识

信用报告怎么写

阅读(185)

本文主要为您介绍信用报告怎么写,内容包括信用调查报告该怎么写呢,个人信用报告异议申请怎么写,信用卡征信报告怎么填。根据《金融信用信息基础数据库个人征信异议处理业务规程》(银征信中心〔2013〕97号文)规定:个人认为信用报告中的信息存在

知识

地产软文怎么写

阅读(168)

本文主要为您介绍地产软文怎么写,内容包括地产软文怎么写,房地产软文怎么写,特点,从哪方面入手,地产软文标题如何写能举些例子吗。软文虽然千变万化,但是万变不离其宗,主要有以下几种方式: 悬念式:也可以叫设问式。核心是提出一个问题,然后围绕

[/e:loop]