实用重点
技术 GEO 大多是技术 SEO,只是对清晰度要求更高。如果一个页面无法被抓取、索引、渲染,或无法展示有用摘要,它就很难成为搜索可见性和 AI 答案可见性的强候选。
Google 对 AI 功能的说明中有一个重点很清楚:除了被索引并有资格展示摘要之外,出现在 AI Overviews 或 AI Mode 中没有额外特殊技术要求。这意味着新手技术工作流不应该追逐神秘 AI 标签。先从可抓取性、可索引性、摘要控制、canonicals、sitemap 健康度、内部链接,以及与可见内容匹配的结构化数据开始。
Hermes 可以读取导出文件,并把它们转成有优先级的审计报告。但它不应该自己修改技术设置。
这次审计检查什么
使用这份新手清单:
| 区域 | Hermes 应该回答的问题 | 为什么重要 |
|---|---|---|
| 可抓取性 | 搜索爬虫能访问这个 URL 吗? | 被阻止页面无法可靠进入搜索索引。 |
| 可索引性 | 页面允许被索引吗? | noindex 页面不应该被期待获得排名或出现在 AI 搜索功能中。 |
| 摘要资格 | 页面是否受到 nosnippet 或 max-snippet 限制? | Google AI 功能要求页面有资格展示摘要。 |
| Canonical | 页面是否指向正确 canonical URL? | 错误 canonical 会把信号合并到错误页面。 |
| Sitemap | 重要 URL 是否在 sitemap 中且干净? | Sitemap 有助于发现和审计。 |
| 结构化数据 | Schema 是否匹配可见页面内容? | 结构化数据能澄清实体和页面用途。 |
| 内部链接 | 重要页面能否通过内部链接被发现? | 孤立页面更难被发现和理解。 |
| 渲染 | 关键内容是否存在于可抓取 HTML 中,或能可靠渲染? | 隐藏或延迟加载内容可能削弱检索。 |
输出应该是一份技术问题队列,包含证据、影响、负责人和审批级别。
第 1 步:收集技术输入
创建这个文件夹:
/hermes-seo-agent
/technical-audit
crawl-export.csv
robots.txt
sitemap-urls.csv
url-inspection-export.csv
structured-data-export.csv
server-log-sample.csv
technical-audit-report.md
technical-fix-queue.md
/qa
technical-seo-geo-gate.md
/prompts
technical-audit-prompt.md
最少文件:
| 文件 | 新手来源 |
|---|---|
|
| Screaming Frog、Sitebulb、Ahrefs、Semrush 或其他爬虫 |
|
| 从 |
|
| 导出 sitemap URLs 或抓取 XML sitemap |
|
| 手动 GSC URL Inspection 记录,或可用时使用 API 导出 |
|
| Rich Results Test 记录、Schema validator 输出,或爬虫 schema 导出 |
|
| 新手可选 |
如果你只有爬虫导出,就从那里开始。Hermes 应该把缺失文件标记为缺失。
第 2 步:让 Hermes 分类技术风险
创建 prompts/technical-audit-prompt.md:
你是技术 SEO/GEO 审计员。
读取 /technical-audit 中的文件。
不要做线上改动。
不要编造缺失数据。
如果某个文件缺失,写“缺失”。
审计这些区域:
1. 可抓取性
2. 可索引性
3. 摘要控制
4. Canonicals
5. Sitemap 收录
6. 结构化数据
7. 内部可发现性
8. 如有数据,渲染或内容可见性问题
对每个问题返回:
- URL
- 问题类型
- 证据
- SEO 影响
- GEO 影响
- 风险等级:低、中、高
- 推荐修复
- 审批负责人
- 是否需要开发者
输出表:
| URL | Issue type | Evidence | SEO impact | GEO impact | Fix | Risk | Owner |
|---|---|---|---|---|---|---|---|
有用的技术审计应该说出具体设置,而不是只说“修复抓取问题”。
第 3 步:检查 robots.txt 和抓取阻塞
Robots.txt 控制抓取,本身不直接控制索引。被阻止的 URL 在某些情况下仍可能出现在搜索中,如果 Google 从其他地方发现它;但阻止重要页面仍然是重大审计项。
提示词:
审查 robots.txt 和爬虫导出。
找出:
1. 被 robots.txt 阻止的重要目录。
2. 被阻止抓取的重要页面。
3. 可能影响渲染的 CSS 或 JavaScript 文件阻止。
4. 可能影响发现的 AI 或搜索爬虫规则。
5. 需要人工审查的 Disallow 规则。
只返回有证据支持的发现。
未经技术审批,不要建议修改 robots.txt。
Robots 发现表:
| 发现 | 为什么重要 | 审批 |
|---|---|---|
|
| 重要信息页面可能无法被抓取 | 需要技术审批 |
|
| 通常正常,但要检查关键资源是否被阻止 | 开发者审查 |
| AI 爬虫规则近期变化 | 可能影响某些 AI 检索系统 | SEO 和法务/政策审查 |
不要让 Hermes 简单地说“全部开放”。Robots 规则可能有合理原因。
第 4 步:检查可索引性和 noindex
可索引性检查应该查看:
noindex- X-Robots-Tag headers
- canonical 冲突
- 应该被抓取但被阻止的页面
- 返回非 200 状态码的页面
- URL inspection 数据中被排除的页面
提示词:
使用 crawl-export.csv 和 url-inspection-export.csv(如可用)审查可索引性。
找出:
1. 被标记为 noindex 的重要页面。
2. 带有 X-Robots-Tag noindex 的重要页面。
3. 预期应为 200 但返回 3xx、4xx 或 5xx 的页面。
4. 如果有 URL inspection 数据,找出 Google 报告未索引的页面。
5. 被 robots 阻止但预期要排名的页面。
将每个发现分类为预期或非预期。
预期 noindex 页面可能包括站内搜索结果、筛选页、staging URLs、thank-you pages 或重复工具页。非预期 noindex 页面需要审查。
第 5 步:检查摘要控制
摘要控制对 GEO 很重要,因为 Google 表示,页面必须有资格展示摘要,才有资格进入 AI Overviews 和 AI Mode。
检查:
nosnippetmax-snippet:0- 非常严格的
max-snippet - 用在重要内容上的
data-nosnippet - meta descriptions 与文章不匹配的页面
提示词:
审查摘要资格。
找出带有这些情况的页面:
1. nosnippet
2. max-snippet:0
3. 非常严格的 max-snippet 值
4. data-nosnippet 包住重要答案内容
5. 缺失或误导性的 meta descriptions
对每个页面解释该限制是预期行为,还是会影响 SEO/GEO 可见性的风险。
未经审批,不要建议移除摘要控制。
使用这张决策表:
| 设置 | 通常安全的情况 | 有风险的情况 |
|---|---|---|
|
| 页面不应展示文本摘要 | 页面目标是获得搜索或 AI 可见性 |
|
| 存在法律或合规原因 | 它隐藏了有用答案内容 |
|
| 需要排除特定隐私或法律文本 | 它包住了主要答案或产品细节 |
第 6 步:检查 canonicals
Canonical 标签告诉搜索引擎哪个 URL 应被视为首选版本。它们很强大,也很容易出错。
提示词:
从爬虫导出中审查 canonical 信号。
找出:
1. 重要页面 canonical 到另一个 URL。
2. Canonical loops 或 chains。
3. Canonicals 指向非 200 URLs。
4. Canonicals 不一致的重复页面。
5. Canonical 选择与内部链接或 sitemap URLs 冲突的页面。
只返回有证据的推荐修复。
将所有 canonical 改动标记为需要技术审批。
Canonical 问题表:
| URL | Current canonical | Expected canonical | Evidence | Risk | Approval |
|---|---|---|---|---|---|
不要让 Hermes 自动改 canonical。错误 canonical 可能让错误页面从搜索考虑中消失。
第 7 步:检查 sitemap 健康度
Sitemap 应该帮助发现和审计。它不应该成为破损、跳转、重复或不可索引 URL 的垃圾场。
提示词:
比较 sitemap-urls.csv 和 crawl-export.csv。
找出 sitemap URLs 中:
1. 非 200 的 URL
2. Redirected URL
3. Noindex URL
4. Canonicalized 到另一个 URL 的 URL
5. 被 robots.txt 阻止的 URL
6. 缺少内部链接的 URL
7. 重要但缺失于 sitemap 的页面
返回 sitemap 清理建议,包含风险等级和审批负责人。
Sitemap 清理通常需要 SEO 审批,有时也需要开发支持,具体取决于 CMS。
第 8 步:检查结构化数据
结构化数据应该描述可见页面内容。它不是神奇 GEO 开关,但在使用正确时,可以帮助澄清实体、页面类型、面包屑、产品、FAQ、文章和组织信息。
提示词:
审查 structured-data-export.csv 和爬虫导出。
找出:
1. 有结构化数据错误的页面。
2. Schema 与可见内容不匹配的页面。
3. 缺少有用 schema 的重要页面类型。
4. 重复或冲突的 schema types。
5. Breadcrumb 或 organization schema 不一致。
每条推荐都包含支持该 schema 的可见内容。
不要推荐没有可见页面内容支持的 schema。
新手 schema 清单:
| 页面类型 | 可考虑的 Schema |
|---|---|
| 博客文章 | Article、BreadcrumbList |
| FAQ 小节 | 只有在 FAQ 可见且符合当前指南时,才使用 FAQPage |
| 产品/工具页 | 适当情况下使用 SoftwareApplication、Product、Organization、BreadcrumbList |
| 本地/服务页 | 只有准确时,才使用 LocalBusiness 或 Service |
| 文档页 | 页面确实符合时,使用 TechArticle 或 HowTo |
Schema 应该先准确,再追求复杂。
第 9 步:创建修复队列
现在让 Hermes 把发现转成队列。
根据审计发现创建 technical-fix-queue.md。
按这些组分类修复:
1. 关键阻塞
2. 可索引性风险
3. 摘要资格风险
4. Canonical 和重复问题
5. Sitemap 清理
6. 结构化数据改进
7. 内部可发现性问题
对每个修复包含:
- URL
- 证据
- 推荐修复
- 预期 SEO 影响
- 预期 GEO 影响
- 实施负责人
- 所需审批
- 是否需要回滚计划:是/否
修复队列模板:
# 技术 SEO/GEO 修复队列
## 关键阻塞
| Priority | URL | Issue | Evidence | Fix | Owner | Approval |
|---|---|---|---|---|---|---|
## 中优先级修复
| Priority | URL | Issue | Evidence | Fix | Owner | Approval |
|---|---|---|---|---|---|---|
## 低风险改进
| Priority | URL | Issue | Evidence | Fix | Owner | Approval |
|---|---|---|---|---|---|---|
不要把 100 个问题塞进一个 sprint。先处理会阻塞重要页面的少数问题。
第 10 步:运行技术审批门
创建 qa/technical-seo-geo-gate.md:
# 技术 SEO/GEO 审批门
- [ ] 每个问题都有证据。
- [ ] 缺失数据已标记为缺失。
- [ ] 关键页面与低价值页面已分开。
- [ ] Robots.txt 改动有技术审批。
- [ ] Noindex 改动有 SEO 和技术审批。
- [ ] Canonical 改动有技术审批。
- [ ] Sitemap 改动有 SEO 或开发审批。
- [ ] 结构化数据匹配可见内容。
- [ ] 如有需要,摘要控制改动有 SEO 和政策审批。
- [ ] 高风险改动有回滚计划。
- [ ] 已安排修复后验证日期。
提示词:
根据 qa/technical-seo-geo-gate.md 审查 technical-fix-queue.md。
返回:
1. 可批准实施的修复
2. 需要更多证据的修复
3. 需要开发者审批的修复
4. 应拒绝的修复
5. 修复后验证步骤
如果某个修复会改变索引、抓取、canonical、redirects 或 schema,就把它当作真正的技术改动。不要把它埋在内容工单里。
第 11 步:修复后验证
技术工作不是工单关闭就结束。必须验证。
修复后清单:
# 修复后验证
- [ ] 重新抓取受影响 URLs。
- [ ] 确认状态码。
- [ ] 确认 robots 访问。
- [ ] 确认可索引性。
- [ ] 确认 canonical。
- [ ] 确认摘要控制。
- [ ] 验证结构化数据。
- [ ] 如果 sitemap 变更,检查 sitemap。
- [ ] 适当时使用 URL Inspection。
- [ ] 记录基线和下次审查日期。
Hermes 提示词:
为已批准的技术修复创建修复后验证计划。
对每个修复包含:
- URL
- 改了什么
- 如何验证
- 使用工具
- 预期结果
- 如果验证失败怎么办
- 审查日期
很多新手审计失败在验证环节。报告看起来很好,但没人检查修复是否真的生效。
新手示例:一个技术 GEO 审计发现
场景:一篇指南本应覆盖 AI 搜索可见性提示词,但搜索表现较弱。
| 数据 | 发现 |
|---|---|
| 爬虫导出 | 页面可索引,状态 200 |
| 摘要检查 | 页面 header 中存在 |
| GSC | 页面有展示,但点击低 |
| GEO 提示词检查 | AI 答案没有引用该页面 |
Hermes 建议:
问题:摘要限制可能限制搜索摘要和 AI 功能资格。
证据:Header 包含 max-snippet:0。
SEO 影响:搜索结果摘要可能受限。
GEO 影响:页面对需要摘要资格的 AI 功能总结可能不具备资格或较弱。
推荐修复:审查 max-snippet:0 存在原因。如果没有法律或产品原因,移除或放宽它。
风险:中。
审批:SEO 负责人;如果该限制原本有意设置,还需要政策/法务审核者。
这才是合适的谨慎程度。Hermes 不应该直接说“删除 max-snippet”。
常见错误
| 错误 | 为什么有害 | 更好的做法 |
|---|---|---|
| 把 GEO 当作特殊标签问题 | 把时间浪费在无依据技巧上 | 修复抓取、索引、摘要、canonical、schema 和内容清晰度 |
| 太快修改 robots.txt | 可能阻止重要页面 | 和技术负责人审查每条规则 |
| 不看上下文就移除 noindex | 可能索引低价值或私密页面 | 区分预期和非预期 noindex |
| 忽略摘要控制 | 可能削弱搜索功能资格 | 审计 nosnippet 和 max-snippet 设置 |
| 添加不可见内容不支持的 schema | 可能违反结构化数据质量预期 | 让 schema 匹配可见内容 |
| 修复后不验证 | 问题可能继续存在 | 重新抓取并检查受影响 URLs |
Auspia 观点
技术 SEO/GEO 审计最好是“无聊”的:找到真实阻塞、展示证据、分配负责人,并阻止高风险改动未经审批上线。
Hermes 在这里有用,是因为它可以整理大型导出,并生成可读的修复队列。它不应该变成半夜修改 robots.txt 的人。在技术负责人批准修复前,让 agent 保持审计员角色。
如果你想做一个入门审计,先检查六件事:可抓取、可索引、摘要资格、正确 canonical、干净 sitemap 和有效结构化数据。
FAQ
技术 GEO 和技术 SEO 不同吗?
大部分情况下,它是把技术 SEO 应用于 AI 搜索准备度。GEO 仍然依赖可抓取、可索引、可理解的页面。额外重点是摘要资格、实体清晰度、答案可提取性和证据质量。
AI Overviews 需要特殊 schema 吗?
没有任何特殊 schema 能保证进入 AI Overview。只有当结构化数据准确描述可见页面内容并符合页面类型时,才使用它。
什么是摘要资格?
摘要资格是指页面允许在搜索结果中展示文本摘要。nosnippet 或非常严格的 max-snippet 等限制,可能影响内容在搜索功能中的呈现方式。
Hermes 应该自动修改 robots.txt 或 canonicals 吗?
不应该。Hermes 可以识别问题并推荐修复,但 robots.txt、noindex、canonical、redirect、sitemap 和结构化数据改动都需要人工技术审批。
新手应该导出哪些爬虫数据?
从 URL、状态码、可索引性、title、meta description、canonical、H1、字数、inlinks、outlinks 开始;如果可用,再加入结构化数据字段。
技术 SEO/GEO 审计应该多频繁运行?
活跃网站每月运行一次轻量爬虫。迁移、CMS 变更、模板变更、流量下降或重大内容发布后,运行更深入审计。
技术修复能保证 AI 引用吗?
不能。技术修复让页面具备资格,并更容易被理解。它不能保证排名、AI 引用或 AI Overview 收录。
继续阅读 Hermes SEO/GEO 系列
- 从这里开始: Hermes SEO/GEO 操作员指南 。
- 上一篇指南: 如何用 Hermes 做内部链接和站点架构 。
- 下一篇指南: 如何搭建 Hermes SEO/GEO swarm 工作流 。
- 密切相关: 如何配置你的第一个 Hermes SEO Agent 、 Hermes SEO/GEO 质量门 。
使用来源
- Google AI features and your website: https://developers.google.com/search/docs/appearance/ai-features
- Google robots.txt introduction: https://developers.google.com/search/docs/crawling-indexing/robots/intro
- Google robots meta tag and X-Robots-Tag: https://developers.google.com/search/docs/crawling-indexing/robots-meta-tag
- Google canonical documentation: https://developers.google.com/search/docs/crawling-indexing/consolidate-duplicate-urls
- Google structured data intro: https://developers.google.com/search/docs/appearance/structured-data/intro-structured-data
- Hermes Agent documentation: https://hermes-agent.nousresearch.com/docs/
作者:Julian Mercer,Auspia 14 年技术 SEO 实践者。Julian 专注于可抓取性、schema、渲染、站点架构和 AI 可读内容的技术基础。