SEO资讯

了解最新的网站建设、全网营销营销、行业动态等资讯,助力企业数字化转型

首页 / SEO资讯 / robots协议禁止收录网站某一篇文章地址

robots协议禁止收录网站某一篇文章地址

2023-09-22 宏哥网络 486 阅读

网站 robots.txt 文件配置方法,如何禁止搜索引擎收录指定网站某一篇超链接地址呢,今天跟着麦站一起学学吧。

搜索引擎通过网络蜘蛛抓取网页的内容,并展示在相关的搜索结果中。但是有些网页内容我们可能并不想被搜索引擎收录和索引,如管理员后台等。

我们就可以通过 robots.txt 文件来声明允许/禁止搜索引擎的蜘蛛抓取某些目录或网页,从而限制搜索引擎的收录范围。

robots协议禁止收录网站某一篇文章地址

什么是 robots.txt

Robots是站点与spider沟通的重要渠道,站点通过robots文件声明本网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。

Robots.txt用法:

User-agent:用于指定指令所作用于的目标抓取工具(网络蜘蛛),后接抓取工具名称;

Disallow:指定不允许抓取的目录或网页,后面为空则表示允许抓取一切页面;

Allow:指定允许抓取的目录或网页;

Sitemap:站点地图的位置,必须是绝对路径;

*:表示通配符;

$:表示网址结束;

/:匹配根目录以及任何下级网址。

禁止抓取某一个超链接:

Disallow: /news/hangyejishu/43.html

robots.txt文件用法举例

robots.txt文件用法举例

Robots.txt工具:

http://tool.chinaz.com/robots/

Robots.txt文件常用写法示例(完整版)

robots.txt文件用法举例:

1. 允许所有的robot访问

User-agent: * Allow: / 或者 User-agent: * Disallow:

2. 禁止所有搜索引擎访问网站的任何部分

User-agent: *

Disallow: /

3. 仅禁止Baiduspider访问您的网站

User-agent: Baiduspider

Disallow: /

4. 仅允许Baiduspider访问您的网站

User-agent: Baiduspider

Disallow:

5. 禁止spider访问特定目录

User-agent: *

Disallow: /cgi-bin/

Disallow: /tmp/

Disallow: /~joe/

6. 允许访问特定目录中的部分url

User-agent: *

Allow: /cgi-bin/see

Allow: /tmp/hi

Allow: /~joe/look

Disallow: /cgi-bin/

Disallow: /tmp/

Disallow: /~joe/

7. 使用”*”限制访问url

禁止访问/cgi-bin/目录下的所有以”.htm”为后缀的URL(包含子目录)。

User-agent: *

Disallow: /cgi-bin/*.htm

8. 使用”$”限制访问url

仅允许访问以”.htm”为后缀的URL。

User-agent: *

Allow: .htm$

Disallow: /

例9. 禁止访问网站中所有的动态页面

User-agent: *

Disallow: /*?*

10. 禁止Baiduspider抓取网站上所有图片

仅允许抓取网页,禁止抓取任何图片。

User-agent: Baiduspider

Disallow: .jpg$

Disallow: .jpeg$

Disallow: .gif$

Disallow: .png$

Disallow: .bmp$

11. 仅允许Baiduspider抓取网页和.gif格式图片

允许抓取网页和gif格式图片,不允许抓取其他格式图片

User-agent: Baiduspider

Allow: .gif$

Disallow: .jpg$

Disallow: .jpeg$

Disallow: .png$

Disallow: .bmp$

12. 仅禁止Baiduspider抓取.jpg格式图片

User-agent: Baiduspider

Disallow: .jpg$


相关文章

百度seo需要什么技术
2023-10-08 5293 阅读

百度seo需要什么技术

做百度seo也好,做谷歌seo也罢,通用的seo技术都可以达成理想结果。从seo技术的角度而言,做好seo需要掌握的技术包括但不限于seo本身,html代码,服务器相关知识,域名相关知识,如何提升网站打开速度相关技术,网站安全设置相关技术,...

阅读更多
网站seo的方法
2023-10-08 5369 阅读

网站seo的方法

关于网站seo优化方法的文章一抓一大把,少部分看到这些文章能从中挖掘出有价值的技术,大部分的人看了就过了。部分真正有seo技术含量的文章是晦涩难懂的,也是流传范围很小的,正是这个原因导致大部分的人看了海量的seo教程,却始终学不到seo方法...

阅读更多
新站seo技巧
2023-10-08 5317 阅读

新站seo技巧

新站seo优化技巧有几个点需要注意。新站上线之初如果有备案,确定使用百度站长工具里面的新站数据提交,新站2个月的扶持期内,只做一个事情:提交大量优质原创受众大的内容,且内容为不间断提交。个人认为这个点是做新站优化的核心点,其余的seo优化技...

阅读更多

有任何问题?联系我们

我们的专业团队随时为您提供帮助和支持

联系我们
电话咨询 在线客服