如何用 Hermes 做技术 SEO/GEO 审计

这篇教程教你用 Hermes 审计技术 SEO/GEO 基础:可抓取性、可索引性、摘要资格、canonicals、sitemap、结构化数据和修复审批流程。

实用重点

技术 GEO 大多是技术 SEO,只是对清晰度要求更高。如果一个页面无法被抓取、索引、渲染,或无法展示有用摘要,它就很难成为搜索可见性和 AI 答案可见性的强候选。

Google 对 AI 功能的说明中有一个重点很清楚:除了被索引并有资格展示摘要之外,出现在 AI Overviews 或 AI Mode 中没有额外特殊技术要求。这意味着新手技术工作流不应该追逐神秘 AI 标签。先从可抓取性、可索引性、摘要控制、canonicals、sitemap 健康度、内部链接,以及与可见内容匹配的结构化数据开始。

Hermes 可以读取导出文件,并把它们转成有优先级的审计报告。但它不应该自己修改技术设置。

这次审计检查什么

使用这份新手清单:

区域

Hermes 应该回答的问题

为什么重要

可抓取性

搜索爬虫能访问这个 URL 吗?

被阻止页面无法可靠进入搜索索引。

可索引性

页面允许被索引吗?

noindex 页面不应该被期待获得排名或出现在 AI 搜索功能中。

摘要资格

页面是否受到 nosnippet 或 max-snippet 限制?

Google AI 功能要求页面有资格展示摘要。

Canonical

页面是否指向正确 canonical URL?

错误 canonical 会把信号合并到错误页面。

Sitemap

重要 URL 是否在 sitemap 中且干净?

Sitemap 有助于发现和审计。

结构化数据

Schema 是否匹配可见页面内容?

结构化数据能澄清实体和页面用途。

内部链接

重要页面能否通过内部链接被发现?

孤立页面更难被发现和理解。

渲染

关键内容是否存在于可抓取 HTML 中,或能可靠渲染?

隐藏或延迟加载内容可能削弱检索。

输出应该是一份技术问题队列,包含证据、影响、负责人和审批级别。

第 1 步:收集技术输入

创建这个文件夹:

/hermes-seo-agent
/technical-audit
crawl-export.csv
robots.txt
sitemap-urls.csv
url-inspection-export.csv
structured-data-export.csv
server-log-sample.csv
technical-audit-report.md
technical-fix-queue.md
/qa
technical-seo-geo-gate.md
/prompts
technical-audit-prompt.md

最少文件:

文件

新手来源

crawl-export.csv

Screaming Frog、Sitebulb、Ahrefs、Semrush 或其他爬虫

robots.txt

https://example.com/robots.txt 下载

sitemap-urls.csv

导出 sitemap URLs 或抓取 XML sitemap

url-inspection-export.csv

手动 GSC URL Inspection 记录,或可用时使用 API 导出

structured-data-export.csv

Rich Results Test 记录、Schema validator 输出,或爬虫 schema 导出

server-log-sample.csv

新手可选

如果你只有爬虫导出,就从那里开始。Hermes 应该把缺失文件标记为缺失。

第 2 步:让 Hermes 分类技术风险

创建 prompts/technical-audit-prompt.md

你是技术 SEO/GEO 审计员。

读取 /technical-audit 中的文件。
不要做线上改动。
不要编造缺失数据。
如果某个文件缺失,写“缺失”。

审计这些区域:
1. 可抓取性
2. 可索引性
3. 摘要控制
4. Canonicals
5. Sitemap 收录
6. 结构化数据
7. 内部可发现性
8. 如有数据,渲染或内容可见性问题

对每个问题返回:
- URL
- 问题类型
- 证据
- SEO 影响
- GEO 影响
- 风险等级:低、中、高
- 推荐修复
- 审批负责人
- 是否需要开发者

输出表:

| URL | Issue type | Evidence | SEO impact | GEO impact | Fix | Risk | Owner |
|---|---|---|---|---|---|---|---|

有用的技术审计应该说出具体设置,而不是只说“修复抓取问题”。

第 3 步:检查 robots.txt 和抓取阻塞

Robots.txt 控制抓取,本身不直接控制索引。被阻止的 URL 在某些情况下仍可能出现在搜索中,如果 Google 从其他地方发现它;但阻止重要页面仍然是重大审计项。

提示词:

审查 robots.txt 和爬虫导出。

找出:
1. 被 robots.txt 阻止的重要目录。
2. 被阻止抓取的重要页面。
3. 可能影响渲染的 CSS 或 JavaScript 文件阻止。
4. 可能影响发现的 AI 或搜索爬虫规则。
5. 需要人工审查的 Disallow 规则。

只返回有证据支持的发现。
未经技术审批,不要建议修改 robots.txt。

Robots 发现表:

发现

为什么重要

审批

/blog/ 被阻止

重要信息页面可能无法被抓取

需要技术审批

/wp-content/ 被阻止

通常正常,但要检查关键资源是否被阻止

开发者审查

AI 爬虫规则近期变化

可能影响某些 AI 检索系统

SEO 和法务/政策审查

不要让 Hermes 简单地说“全部开放”。Robots 规则可能有合理原因。

第 4 步:检查可索引性和 noindex

可索引性检查应该查看:

  • noindex
  • X-Robots-Tag headers
  • canonical 冲突
  • 应该被抓取但被阻止的页面
  • 返回非 200 状态码的页面
  • URL inspection 数据中被排除的页面

提示词:

使用 crawl-export.csv 和 url-inspection-export.csv(如可用)审查可索引性。

找出:
1. 被标记为 noindex 的重要页面。
2. 带有 X-Robots-Tag noindex 的重要页面。
3. 预期应为 200 但返回 3xx、4xx 或 5xx 的页面。
4. 如果有 URL inspection 数据,找出 Google 报告未索引的页面。
5. 被 robots 阻止但预期要排名的页面。

将每个发现分类为预期或非预期。

预期 noindex 页面可能包括站内搜索结果、筛选页、staging URLs、thank-you pages 或重复工具页。非预期 noindex 页面需要审查。

第 5 步:检查摘要控制

摘要控制对 GEO 很重要,因为 Google 表示,页面必须有资格展示摘要,才有资格进入 AI Overviews 和 AI Mode。

检查:

  • nosnippet
  • max-snippet:0
  • 非常严格的 max-snippet
  • 用在重要内容上的 data-nosnippet
  • meta descriptions 与文章不匹配的页面

提示词:

审查摘要资格。

找出带有这些情况的页面:
1. nosnippet
2. max-snippet:0
3. 非常严格的 max-snippet 值
4. data-nosnippet 包住重要答案内容
5. 缺失或误导性的 meta descriptions

对每个页面解释该限制是预期行为,还是会影响 SEO/GEO 可见性的风险。
未经审批,不要建议移除摘要控制。

使用这张决策表:

设置

通常安全的情况

有风险的情况

nosnippet

页面不应展示文本摘要

页面目标是获得搜索或 AI 可见性

max-snippet

存在法律或合规原因

它隐藏了有用答案内容

data-nosnippet

需要排除特定隐私或法律文本

它包住了主要答案或产品细节

第 6 步:检查 canonicals

Canonical 标签告诉搜索引擎哪个 URL 应被视为首选版本。它们很强大,也很容易出错。

提示词:

从爬虫导出中审查 canonical 信号。

找出:
1. 重要页面 canonical 到另一个 URL。
2. Canonical loops 或 chains。
3. Canonicals 指向非 200 URLs。
4. Canonicals 不一致的重复页面。
5. Canonical 选择与内部链接或 sitemap URLs 冲突的页面。

只返回有证据的推荐修复。
将所有 canonical 改动标记为需要技术审批。

Canonical 问题表:

| URL | Current canonical | Expected canonical | Evidence | Risk | Approval |
|---|---|---|---|---|---|

不要让 Hermes 自动改 canonical。错误 canonical 可能让错误页面从搜索考虑中消失。

六项技术 GEO 资格检查清单:URL 可抓取、页面可索引、摘要资格、正确 canonical、干净 sitemap 和有效结构化数据。

第 7 步:检查 sitemap 健康度

Sitemap 应该帮助发现和审计。它不应该成为破损、跳转、重复或不可索引 URL 的垃圾场。

提示词:

比较 sitemap-urls.csv 和 crawl-export.csv。

找出 sitemap URLs 中:
1. 非 200 的 URL
2. Redirected URL
3. Noindex URL
4. Canonicalized 到另一个 URL 的 URL
5. 被 robots.txt 阻止的 URL
6. 缺少内部链接的 URL
7. 重要但缺失于 sitemap 的页面

返回 sitemap 清理建议,包含风险等级和审批负责人。

Sitemap 清理通常需要 SEO 审批,有时也需要开发支持,具体取决于 CMS。

第 8 步:检查结构化数据

结构化数据应该描述可见页面内容。它不是神奇 GEO 开关,但在使用正确时,可以帮助澄清实体、页面类型、面包屑、产品、FAQ、文章和组织信息。

提示词:

审查 structured-data-export.csv 和爬虫导出。

找出:
1. 有结构化数据错误的页面。
2. Schema 与可见内容不匹配的页面。
3. 缺少有用 schema 的重要页面类型。
4. 重复或冲突的 schema types。
5. Breadcrumb 或 organization schema 不一致。

每条推荐都包含支持该 schema 的可见内容。
不要推荐没有可见页面内容支持的 schema。

新手 schema 清单:

页面类型

可考虑的 Schema

博客文章

Article、BreadcrumbList

FAQ 小节

只有在 FAQ 可见且符合当前指南时,才使用 FAQPage

产品/工具页

适当情况下使用 SoftwareApplication、Product、Organization、BreadcrumbList

本地/服务页

只有准确时,才使用 LocalBusiness 或 Service

文档页

页面确实符合时,使用 TechArticle 或 HowTo

Schema 应该先准确,再追求复杂。

第 9 步:创建修复队列

现在让 Hermes 把发现转成队列。

根据审计发现创建 technical-fix-queue.md。

按这些组分类修复:
1. 关键阻塞
2. 可索引性风险
3. 摘要资格风险
4. Canonical 和重复问题
5. Sitemap 清理
6. 结构化数据改进
7. 内部可发现性问题

对每个修复包含:
- URL
- 证据
- 推荐修复
- 预期 SEO 影响
- 预期 GEO 影响
- 实施负责人
- 所需审批
- 是否需要回滚计划:是/否

修复队列模板:

# 技术 SEO/GEO 修复队列

## 关键阻塞
| Priority | URL | Issue | Evidence | Fix | Owner | Approval |
|---|---|---|---|---|---|---|

## 中优先级修复
| Priority | URL | Issue | Evidence | Fix | Owner | Approval |
|---|---|---|---|---|---|---|

## 低风险改进
| Priority | URL | Issue | Evidence | Fix | Owner | Approval |
|---|---|---|---|---|---|---|

不要把 100 个问题塞进一个 sprint。先处理会阻塞重要页面的少数问题。

第 10 步:运行技术审批门

创建 qa/technical-seo-geo-gate.md

# 技术 SEO/GEO 审批门

- [ ] 每个问题都有证据。
- [ ] 缺失数据已标记为缺失。
- [ ] 关键页面与低价值页面已分开。
- [ ] Robots.txt 改动有技术审批。
- [ ] Noindex 改动有 SEO 和技术审批。
- [ ] Canonical 改动有技术审批。
- [ ] Sitemap 改动有 SEO 或开发审批。
- [ ] 结构化数据匹配可见内容。
- [ ] 如有需要,摘要控制改动有 SEO 和政策审批。
- [ ] 高风险改动有回滚计划。
- [ ] 已安排修复后验证日期。

提示词:

根据 qa/technical-seo-geo-gate.md 审查 technical-fix-queue.md。

返回:
1. 可批准实施的修复
2. 需要更多证据的修复
3. 需要开发者审批的修复
4. 应拒绝的修复
5. 修复后验证步骤

如果某个修复会改变索引、抓取、canonical、redirects 或 schema,就把它当作真正的技术改动。不要把它埋在内容工单里。

第 11 步:修复后验证

技术工作不是工单关闭就结束。必须验证。

修复后清单:

# 修复后验证

- [ ] 重新抓取受影响 URLs。
- [ ] 确认状态码。
- [ ] 确认 robots 访问。
- [ ] 确认可索引性。
- [ ] 确认 canonical。
- [ ] 确认摘要控制。
- [ ] 验证结构化数据。
- [ ] 如果 sitemap 变更,检查 sitemap。
- [ ] 适当时使用 URL Inspection。
- [ ] 记录基线和下次审查日期。

Hermes 提示词:

为已批准的技术修复创建修复后验证计划。

对每个修复包含:
- URL
- 改了什么
- 如何验证
- 使用工具
- 预期结果
- 如果验证失败怎么办
- 审查日期

很多新手审计失败在验证环节。报告看起来很好,但没人检查修复是否真的生效。

新手示例:一个技术 GEO 审计发现

场景:一篇指南本应覆盖 AI 搜索可见性提示词,但搜索表现较弱。

数据

发现

爬虫导出

页面可索引,状态 200

摘要检查

页面 header 中存在 max-snippet:0

GSC

页面有展示,但点击低

GEO 提示词检查

AI 答案没有引用该页面

Hermes 建议:

问题:摘要限制可能限制搜索摘要和 AI 功能资格。
证据:Header 包含 max-snippet:0。
SEO 影响:搜索结果摘要可能受限。
GEO 影响:页面对需要摘要资格的 AI 功能总结可能不具备资格或较弱。
推荐修复:审查 max-snippet:0 存在原因。如果没有法律或产品原因,移除或放宽它。
风险:中。
审批:SEO 负责人;如果该限制原本有意设置,还需要政策/法务审核者。

这才是合适的谨慎程度。Hermes 不应该直接说“删除 max-snippet”。

常见错误

错误

为什么有害

更好的做法

把 GEO 当作特殊标签问题

把时间浪费在无依据技巧上

修复抓取、索引、摘要、canonical、schema 和内容清晰度

太快修改 robots.txt

可能阻止重要页面

和技术负责人审查每条规则

不看上下文就移除 noindex

可能索引低价值或私密页面

区分预期和非预期 noindex

忽略摘要控制

可能削弱搜索功能资格

审计 nosnippet 和 max-snippet 设置

添加不可见内容不支持的 schema

可能违反结构化数据质量预期

让 schema 匹配可见内容

修复后不验证

问题可能继续存在

重新抓取并检查受影响 URLs

Auspia 观点

技术 SEO/GEO 审计最好是“无聊”的:找到真实阻塞、展示证据、分配负责人,并阻止高风险改动未经审批上线。

Hermes 在这里有用,是因为它可以整理大型导出,并生成可读的修复队列。它不应该变成半夜修改 robots.txt 的人。在技术负责人批准修复前,让 agent 保持审计员角色。

如果你想做一个入门审计,先检查六件事:可抓取、可索引、摘要资格、正确 canonical、干净 sitemap 和有效结构化数据。

FAQ

技术 GEO 和技术 SEO 不同吗?

大部分情况下,它是把技术 SEO 应用于 AI 搜索准备度。GEO 仍然依赖可抓取、可索引、可理解的页面。额外重点是摘要资格、实体清晰度、答案可提取性和证据质量。

AI Overviews 需要特殊 schema 吗?

没有任何特殊 schema 能保证进入 AI Overview。只有当结构化数据准确描述可见页面内容并符合页面类型时,才使用它。

什么是摘要资格?

摘要资格是指页面允许在搜索结果中展示文本摘要。nosnippet 或非常严格的 max-snippet 等限制,可能影响内容在搜索功能中的呈现方式。

Hermes 应该自动修改 robots.txt 或 canonicals 吗?

不应该。Hermes 可以识别问题并推荐修复,但 robots.txt、noindex、canonical、redirect、sitemap 和结构化数据改动都需要人工技术审批。

新手应该导出哪些爬虫数据?

从 URL、状态码、可索引性、title、meta description、canonical、H1、字数、inlinks、outlinks 开始;如果可用,再加入结构化数据字段。

技术 SEO/GEO 审计应该多频繁运行?

活跃网站每月运行一次轻量爬虫。迁移、CMS 变更、模板变更、流量下降或重大内容发布后,运行更深入审计。

技术修复能保证 AI 引用吗?

不能。技术修复让页面具备资格,并更容易被理解。它不能保证排名、AI 引用或 AI Overview 收录。

继续阅读 Hermes SEO/GEO 系列

使用来源

  • Google AI features and your website: https://developers.google.com/search/docs/appearance/ai-features
  • Google robots.txt introduction: https://developers.google.com/search/docs/crawling-indexing/robots/intro
  • Google robots meta tag and X-Robots-Tag: https://developers.google.com/search/docs/crawling-indexing/robots-meta-tag
  • Google canonical documentation: https://developers.google.com/search/docs/crawling-indexing/consolidate-duplicate-urls
  • Google structured data intro: https://developers.google.com/search/docs/appearance/structured-data/intro-structured-data
  • Hermes Agent documentation: https://hermes-agent.nousresearch.com/docs/

作者:Julian Mercer,Auspia 14 年技术 SEO 实践者。Julian 专注于可抓取性、schema、渲染、站点架构和 AI 可读内容的技术基础。

探索此主题

继续阅读同一增长脉络