无需登录 数据私有 本地保存

XML Sitemap 验证器 - 格式与URL检查

10
0
0
0
XML Sitemap 验证器
格式检查 · URL提取 · 可达性探测
0 字符

拖拽 XML 文件到此处

或点击选择文件

尝试发送请求验证URL是否可达。受浏览器CORS策略限制,部分URL可能无法验证。 超过 200 个URL时将仅检查前200个。

等待验证

粘贴XML内容或上传文件,然后点击"验证 Sitemap"

常见问题与知识点

XML Sitemap 是一个列出网站所有重要页面的文件,帮助搜索引擎(如Google、Bing)更高效地抓取和索引网站内容。它就像网站的"目录",告诉搜索引擎哪些页面存在、何时更新、优先级如何。对于SEO而言,提交Sitemap可以加速页面被收录,尤其对大型网站、新网站或内容更新频繁的网站至关重要。

Sitemap遵循XML标准,根元素为<urlset>(普通Sitemap)或<sitemapindex>(Sitemap索引)。必须包含命名空间声明xmlns="http://www.sitemaps.org/schemas/sitemap/0.9"。每个<url>元素必须包含<loc>(完整URL),可选包含<lastmod>(最后修改日期,W3C格式)、<changefreq>(更新频率)和<priority>(优先级0.0-1.0)。

根据协议,单个Sitemap文件最多包含50,000个URL,且未压缩时文件大小不超过50MB(压缩后建议不超过50MB)。如果URL数量或文件大小超出限制,应使用Sitemap Index文件将其拆分为多个子Sitemap。Sitemap Index本身也受同样的大小限制。

Sitemap Index(站点地图索引)是一个指向多个Sitemap文件的索引文件,根元素为<sitemapindex>。每个<sitemap>条目包含子Sitemap的<loc>和可选的<lastmod>。当网站页面超过50,000个或Sitemap文件超过50MB时,必须使用Sitemap Index。搜索引擎会先读取索引文件,再逐个抓取子Sitemap。

常见错误包括:URL格式不正确(缺少协议、包含非法字符)、XML格式错误(标签未闭合、编码问题)、URL未做实体转义(&需写为&)、使用了相对URL(必须使用绝对URL)、日期格式不符合W3C标准priority值超出0.0-1.0范围changefreq值不在允许列表中。本工具可帮助检测大部分此类问题。

提交方式包括:1) 通过Google Search Console或Bing Webmaster Tools直接提交Sitemap URL;2) 在robots.txt文件中添加Sitemap: https://yourdomain.com/sitemap.xml3) 使用搜索引擎的Ping工具发送GET请求。建议同时使用多种方式确保搜索引擎及时发现Sitemap。