robots.txt生成器 - 在线搜索引擎爬虫规则配置

SEO工具生成器 robots.txt SEO 生成器

Robots.txt 生成器

在线搜索引擎爬虫规则配置工具 — 可视化生成标准 robots.txt 文件

快速模板

完全开放允许所有爬虫

完全禁止拒绝所有爬虫

WordPress WP标准配置

屏蔽AI爬虫 GPTBot/CCBot

SEO推荐主流搜索引擎

极简配置仅Sitemap

规则配置 0 条规则

目标爬虫 (User-agent)

自定义

选择目标爬虫，使用 * 匹配所有爬虫。可同时选择多个。

访问规则

提示：路径支持通配符 *（任意字符序列）和 $（URL结尾）。如 /*.pdf$ 匹配所有PDF文件。

Sitemap 站点地图

请输入完整的Sitemap URL，如 https://example.com/sitemap.xml

Crawl-delay 爬取延迟（秒）

秒

可选。设置爬虫两次请求之间的等待秒数。Googlebot不支持此指令，Bing/Yahoo支持。

实时预览已生成

# 请配置规则后预览

使用提示

robots.txt 文件应放置在网站根目录，如 https://yoursite.com/robots.txt
该文件不是安全机制，仅是爬虫的礼貌协议，恶意爬虫可能忽略它
规则中路径区分大小写，/Admin/ ≠ /admin/
Disallow: / 表示禁止访问整个网站；Disallow:（空值）表示不禁止任何内容
每条 User-agent 指令开启一个新的规则块，直到下一个 User-agent
Google 建议 robots.txt 文件大小不超过 500KB

通配符速查

通配符	含义	示例
`*`	匹配任意字符序列	`/*.pdf` 匹配所有PDF
`$`	匹配URL结尾	`/page$` 仅匹配 /page，不匹配 /page/
`/`	根目录	`Disallow: /` 禁止整个站点
组合使用：`/?` 匹配所有带查询参数的URL

常见问题 FAQ

robots.txt 是网站根目录下的一个纯文本文件，用于告知搜索引擎爬虫（如Googlebot、Bingbot）哪些页面或目录可以抓取，哪些不可以。它遵循机器人排除协议（Robots Exclusion Protocol），是SEO优化的基础配置之一。

正确配置 robots.txt 可以：避免爬虫抓取敏感或无用页面（如后台、重复内容）、节省服务器带宽资源（Crawl Budget）、引导爬虫优先抓取重要内容、配合Sitemap提升网站收录效率。

Disallow 用于禁止爬虫访问指定路径，Allow 用于在禁止范围内开放特定路径。规则按从上到下的顺序匹配，最具体的匹配规则优先。

常见场景：禁止 /private/ 目录但允许其中的 /private/public-docs/ 子目录：

Disallow: /private/
Allow: /private/public-docs/

不能！ robots.txt 只是一个公开的协议建议，任何用户都可以直接访问 https://yoursite.com/robots.txt 查看其内容。恶意爬虫完全可以忽略这些规则。如需保护敏感数据，请使用身份验证、IP限制、密码保护等真正的安全措施，而不是依赖 robots.txt。

您可以通过以下方式验证：

Google Search Console：使用「robots.txt 测试工具」输入URL进行实时测试
直接访问：在浏览器中打开 https://你的域名/robots.txt 确认内容正确
命令行工具：使用 curl https://你的域名/robots.txt 检查返回内容
本工具：使用本生成器的实时预览功能，下载后上传到网站根目录即可

Crawl-delay 指定爬虫两次请求之间的等待秒数。注意：Googlebot 不支持此指令（需通过Google Search Console设置抓取速率），但Bing、Yahoo、Yandex等支持。

一般建议：小型网站无需设置；中型网站可设置 3-5 秒；大型网站或服务器性能有限时可设置 5-10 秒。设置过大会导致搜索引擎收录缓慢。

是否屏蔽AI爬虫取决于您的内容策略。屏蔽后您的网站内容不会被用于训练大型语言模型（LLM）。常见的AI爬虫包括：

GPTBot — OpenAI（ChatGPT训练数据收集）
CCBot — Common Crawl（公开数据集，被多家AI公司使用）
anthropic-ai — Anthropic（Claude训练数据）
Google-Extended — Google（Bard/Gemini训练，独立于Googlebot索引）

robots.txt SEO 知识点

📄 文件位置

必须放在网站根目录，如 /robots.txt。子目录下的 robots.txt 不会被爬虫识别。仅对 HTTP/HTTPS 协议有效，FTP 不适用。

🔍 爬虫识别

主流搜索引擎爬虫会定期检查 robots.txt。如果文件返回 404 状态码，爬虫会认为没有限制，正常抓取整个网站。

⚠️ 常见误区

将 noindex 与 robots.txt 混淆。robots.txt 只能阻止抓取，不能阻止索引。已抓取的页面如需从搜索结果中移除，应使用 meta robots noindex 标签。

已复制到剪贴板！

SEO 友好 URL 生成器 - 中文转拼音/英文 slug

将文章标题转换为适合 URL 的格式，支持中文拼音或英文 slug，移除停用词。

日志文件实时浏览模拟 - 粘贴并自动滚动

粘贴多行日志，自动滚动到底部，并支持关键字高亮筛选。

开发工具分析日志浏览高亮

词根词缀构词器 - 组合前缀/词根/后缀造词

选择前缀、词根和后缀进行组合，查看是否构成真实单词及释义。

教育工具学习构词词根词缀

周时间块规划表 - 拖拽任务到时间槽

在每周日历上拖拽预先设定的任务块，可视化一周时间分配。

效率工具周计划拖拽时间块规划

词语搭配查询器 - 常用组合检测

输入英文单词对，检查它们是否构成常见搭配，并给出示例。

写作工具写作搭配英语

周报生成器 - 自动汇总本周工作与计划

填写本周完成事项与下周计划，选择模板一键生成专业周报，支持复制或导出图片，提升汇报效率。

办公工具周报报告模板生成器

企业员工通讯录 - 按部门/姓名快速查找

本地存储员工分机、手机与邮箱，搜索过滤，适合小团队内部分享。

办公工具企业员工搜索通讯录

简单英语语法检查 - 主谓一致/时态提示

对输入的英文句子进行基础的语法模式匹配，标注可能的错误。

写作工具检查英语语法

借条/欠条生成器 - 标准模板填写

填写借款信息，生成简单借贷收据图片，含必要字段（仅供参考）。

生成器借条模板生成

儿童句子组建器 - 拖拽单词造句

提供一系列打乱的单词方块，拖拽排列成正确的英文句子。

教育工具儿童句子组建

工作日志本 - 每日记录与周报素材

按日期记录工作内容、收获与困难，标签分类，快速汇总本周事项生成周报底稿。

办公工具周报工作日志日报记录

文本简化器 - 用更常见的词替换

尝试将文章中的复杂单词替换为更基础的同义词，降低阅读难度。

教育工具简化英语词汇

英语习语图解词典 - 含义/例句/漫画场景

搜索或随机浏览英语习语，查看形象漫画与例句，有趣掌握地道表达。

教育工具习语图解学习英语

英语词源探索器 - 输入单词看演化树

输入英文单词，以简单图谱展示其从古语到现代的演变。

教育工具历史演化英语词源

复合词合成器 - 看图将两词组合

给出两个单独的单词图片(如“butter”+“fly”)，将它们组合成一个新词。

教育工具复合词游戏英语

词族显示工具 - 相同词根的单词

输入一个单词，显示由相同词根衍生出的单词家族（如 act, action, react）。

教育工具英语词族词根

英语词性判断练习 - 给句子中单词标注

显示英文句子，要求点击每个单词选择正确词性，即时反馈学习效果。

教育工具练习英语词性语法

英语词汇量估测器 - 抽样检查测大小

通过抽选60个随机单词考察识别度，利用统计估算你的英语被动词汇量。

教育工具估测英语词汇量

北约音标字母练习器 - 语音识别对比

麦克风说出字母，检验是否准确匹配Alfa, Bravo等音标词，通信员口语训练。

教育工具北约音标口语字母练习

ConfigMap 生成器 - 从键值对快速生成 Kubernetes 资源

输入键值对，自动生成 Kubernetes ConfigMap YAML，支持文字和多行数据。

DevOps ConfigMap Kubernetes 生成器配置

SEO标题/描述预览工具 - 模拟搜索结果卡片

输入标题与描述，模拟Google搜索结果片段，检查截断与关键词效果。

SEO工具 SEO 描述标题预览

Canonical URL 分析器 - 规范链接一致性检查

检测输入页面与声明Canonical的指向，识别不一致与循环引用，防止内容重复。

SEO工具 Canonical SEO 一致性链接

保密协议(NDA)在线生成器 - 免费定制法律模板

填写双方信息及保密范围，一键生成标准保密协议文档，支持导出PDF，适合初创团队与自由职业者。

办公工具 NDA 保密协议模板生成器

Popover弹窗生成器 - 纯HTML声明式弹出层

配置内容和位置，生成使用最新HTML popover属性的轻量弹窗代码，无需JavaScript。

前端设计 HTML Popover 生成器

内容重复度检测器 - 两篇文章比对

比较两篇文本的相似度百分比，并高亮相同句子，避免重复内容惩罚。

SEO工具 SEO 检测重复度

链接短码生成器 - 随机安全字符串链接

输入长链接，生成一个伴随随机短码的完整离线URL（可自定义域名前缀）。

开发工具生成器短链接随机

Identicon头像生成器 - 哈希几何图案标识

根据用户名字符串，用哈希值生成对称的几何图案头像，用于默认用户图标。

图像工具 Identicon 头像生成器

春联/对联生成器 - 根据关键词生成下联

输入上联或主题词，基于对联规则和词库尝试生成工整的下联，用于春节或文娱。

文化工具传统对联生成器

SVG环形进度条生成器 - 绘图进度圈

设定百分比、颜色和粗细，生成环形SVG进度条代码，可增加动画。

前端设计 SVG 生成器进度条

虚拟信用卡号生成 - 测试用有效Luhn卡号

生成通过Luhn算法校验但无实际金钱的卡片号码，附带有效日期供开发测试。

开发工具信用卡测试生成器

robots.txt生成器 - 在线搜索引擎爬虫规则配置