绿条 = 要背口语 绿胶囊 = 第一/第二/收尾黄底 = 关键数字灰底 = 口径·不用念蓝条 = 问法 琥珀卡 = 口诀脚手架 🃏 点题目展开答案 · 手机用底栏跳转

马凯强 · 面试背诵稿（从上到下背 · 2026）

对齐简历：马凯强-AI产品经理 (3).pdf · 目标：面试拿 offer 用法：从下一行开始，严格从上到下背。 背完 块 1→2→3→4 再翻第二阶段。

本稿格式（块 4 及问答区统一）

样式	什么意思
粗体	题号、小节名、关键数字——扫一眼即可，不必整句背
正文	要背的口语，面试里直接照着说
斜体	提示、不用背、心里记住、跳转到别章
【口诀】	背稿脚手架（口诀→图像锚点→再扩绿条口语）——面试不念

背诵路线图（就按这个顺序）

顺序	块	内容	时间
1	块 1	自我介绍 120 秒（含常见追问：Dify · 年龄 · 后台原型）	第 1 天
2	块 2	Agent 记忆 + MCP	第 1～2 天
3	块 3	人事 NL2SQL + 制度 RAG，各 1 分钟	第 2～3 天
4	块 4	60 题 · 每次练一个分类约 10 题	第 3 天起
—	第二阶段	定位题、技术词、其他项目、行为面… 查阅用	块 1～4 背熟后

心态（块 4 第 60 题）：背题是为了 有词可说，真正主场是 国能 6 个 Agent + AI 简历优化 两个项目——答不上概念题时，先分清 国能 ToB 还是 简历 0-1，再拉回「我在那个项目里是这么做的…」

背诵方法 · 口诀 + 3-4-3（不用念给面试官）

这是背稿训练法，面试时不要说出来。

3-4-3 读熟节奏（每块目标约 10 遍）

1～3 遍 · 顺句读：只念通顺；卡壳词（RAG、MCP、五层安全…）标出并 单独念 5 遍
4～7 遍 · 断句读：按「第一 / 第二 / 收尾」或「层一 / 层二」停在断点处
8～10 遍 · 脱稿读：只看 块口诀 + 图像锚点；卡壳 只回看那一句，不从头重读整段

核心数据打包（考前 30 秒默写）

数字	记法	在本稿哪里
95%	准	回答准确率 · 查询成功率 · 隐患分类
70%	降	制度/人事人工咨询量下降（两项目都有）
60%	省	FAQ 分流后 Token 下降
100%	满	制度/人事类自助化率

口诀： 95 准 · 70 降 · 60 省 · 100 满

每日 10 分钟巩固

早 5 分钟：合上书背完全部 块口诀；默写 95 / 70 / 60
晚 5 分钟：随机抽 1 块，用 图像锚点 闭眼回忆；块 4 用闪卡大声答约 10 题
考前 30 分钟：只扫 口诀 + 上表 + 附9 清单，不读全文

断点不卡壳（录音法）

每块用手机 录一遍脱稿
回听标 卡壳断点，为该句编 迷你口诀（例：MCP 产品职责 → 清单·说明书·监控·安全·确认）
遮挡练：盖住稿中黄底数字，只看空白说出

【口诀·块1】不念给面试官 · 先口诀再扩绿条

口诀35岁14年，国能6Agent，简历0-1全

图像锚点时间轴叠积木 — ERP/OA（24→35家）→ 国能 6 款 Agent → 简历 PRD+39 页+后台

拆解35岁 · 14年ToB · 6 Agent（RAG/NL2SQL…）· 简历 0-1 全链路

练法闭眼念口诀 → 扩成三段（数字化 / 国能 / 简历）→ 再填绿条口语

块 1 · 120 秒自我介绍（必背 · 可直接念 · 对齐简历）

大家好，我叫马凯强，35 岁，在广州，14 年 ToB 产品经验，Java 开发工程师出身，求职 AI 产品经理，期望在广州发展。

2012 到 2025 年 4 月，我主导 业财一体化 ERP、移动 OA、财税知识付费 等 10 多款 集团级产品从 0 到 1，擅长复杂流程、数据治理和跨系统集成，带过团队；在金不换支撑分公司从 24 家扩张至 35 家，千人组织 系统使用率 100%——这段是 数字化项目，不是 AI 项目。

2025 年 5 月到 2026 年 2 月，我在金安尚科技驻场国能肇庆，基于 Dify 从 0 搭建 6 款集团级 AI Agent：RAG 知识库问答、自然语言 SQL 数据查询（人事、燃料）、培训出题、隐患分类派单、缺陷闭环跟踪。我负责需求拆解、工作流编排、Prompt 工程、Bad Case 复盘和效果评估。上线后制度/人事类咨询 自助化率 100%，人工咨询量 下降约 70%，回答准确率 ≥95%；数据查询从 小时级到秒级，查询成功率 ≥95%；隐患分类 ≥95%，配合 人工确认后再生效。

2026 年 2 月 项目交付离职后，我独立推进 C 端 AI 简历优化助手（0-1）：PRD v1.3.2（含 AI 专章）、39 页 C 端小程序高保真原型 + 全模块 B 端运营后台原型（用户服务、套餐 SKU、课程 CMS、提示词/文案/能量点/风控审计等，含接口字段与验收说明），以及研发交接包；用 Cursor 做端到端产品验证，主路径约 15 分钟 从摸底到导出 PDF。

我的优势是 研发背景 + 14 年 ToB 落地 + 近一年 Agent 全链路，能和算法、后端一起把 AI 产品 做准、做稳、可审计。谢谢。

口径口径（心里记住，不必念出来）：2025.05 前 只讲 ERP/OA/数字化；2025.05 起 才讲 LLM/Agent。简历里的 RAG 就是「先查制度库再回答」；NL2SQL 就是「说人话查数据库，只读、有权限」。

常见追问：为什么用 Dify，不做一个「AI 对话框」让用户直接问？

问法：「为什么不接个大模型聊天框？」「ChatGPT 套壳不行吗？」

💬 你可以这样答

我们早期也对比过 「一个对话框 + 大模型」，但在国能这种 央企 ToB 场景，单靠聊天框不够，原因很实在：

第一，业务不是一问一答。

制度问答要先 检索知识库，没有命中就不能编；人事查数要 生成 SQL → 校验危险语句 → 只读库 → 按人做行级权限 → 再用人话总结；隐患要 输出固定 JSON → 人工确认 → 才写入工单。这是 一条工作流，不是一轮对话能兜住的。

第二，企业要能管、能查、能回滚。

我们要 Prompt 版本、Bad Case 复盘、FAQ 分流降 Token、异常转人工、操作审计。Dify 这类编排平台，让产品和研发能 可视化拆节点、快速改流程；纯对话框要把这些全塞进前后端自研，周期和运维成本都更高。

第三，成本和准确率。

比如人事 Agent，高频问题走 FAQ 本地匹配，复杂问题才调大模型，Token 降 60% 以上。单纯对话框往往 每问都调大模型，贵，还不一定准。

收尾：

所以我的选型逻辑是：场景简单 → 对话或 FAQ 够用；场景复杂 → 工作流 + 检索 + 工具。Dify 是当时的 落地载体，不是唯一答案；若贵司有自研 Agent 平台，我照样按 流程、权限、评估 这套产品方法设计。C 端简历也不是聊天框，而是 分步骤的主路径 + 后台可配，道理一样。

常见追问：年龄偏大 / 1990 年 / 35 岁还做 AI 产品吗？

问法：「你年龄不小了」「1990 年的，跟得上 AI 吗？」「我们更想要年轻人」

💬 你可以这样答

我理解您关心的是 能不能把 AI 产品落地、能不能长期稳定交付，我正面回答。

第一，岗位要的是「做准、做稳、可审计」，不只是追热点。

我 Java 出身 + 14 年 ToB，在国能把 6 款 Agent 从需求做到上线指标；C 端简历也是 PRD → 原型 → 后台配置 → 研发发包 全链路。AI PM 很多难点在 权限、合规、Bad Case、跨部门对齐——这些靠 项目经验，不靠年龄小。

第二，我在 AI 上不是「旁观者」。

2025 年 5 月起 全职做 LLM Agent（RAG、NL2SQL、工作流、Prompt 迭代）；离职后 独立推进 C 端 0-1，工具用 Cursor，方法和国能同一套：指标、评测、成本、Human-in-the-loop。

第三，年龄对应的是企业落地必需、但很难短期练出来的能力。

年轻同事往往 工具学得快、想法新；我这边补的是 14 年 ToB 沉淀：

业务落地：复杂流程、数据治理、跨系统对接，知道什么该先做 MVP、什么不能省；
管理与交付：带过团队、扛过 24→35 家 扩张和金不换 100% 使用率，国能 6 款 Agent 按期上线；
沟通与推动：国能做过 6 部门访谈、12 场培训，能把业务、研发、合规 拉到同一张验收表上。

大模型可以换、平台可以换，但 AI 进企业 最后卡在 对齐指标、过合规、推上线、守运营——这些正是我的强项。

收尾（不卑不亢）：

我不是和年轻人比「谁更会用新工具」，而是 AI 能力 + 企业落地能力 一起带进来。若贵司偏 B 端 Agent / 合规 ToB，这套组合是匹配的；您也可以直接考我 某个场景怎么拆工作流、怎么定指标——用专业说话。

口径口径（心里记住）：不道歉、不贬低年轻人（可说「年轻同事工具学得快」）；强调互补而非替代；1990 年 ≈ 35 岁，与自我介绍一致即可。

常见追问：项目链接里怎么只有小程序，后台呢？

问法：「你这项目是不是只做了前端？」「运营后台在哪？」

💬 你可以这样答

不是只做 C 端。我交付的是 C 端 39 页 + 全模块 B 端运营后台原型，后台覆盖 留言/退款、用户 360°、订单与 SKU、课程 CMS、提示词与系统文案、邀请增长、数据大屏、审计与风控 等；每页有 dev-spec、接口 METHOD/path、字段映射和验收路径，研发可以 仅凭文档联调。

公开链接因项目保密，目前只放了 C 端演示；后台和完整接口包 面试时可以现场打开（本地 HTML 原型 + 交接文档），或按模块给您 口述清单。我角色是 产品经理，原型是 Vibe Coding 验证；正式上线仍要研发工程化，但 后台怎么配、接口怎么定 是我输出的。

【口诀·块2】不念给面试官 · 先口诀再扩绿条

口诀记忆分四层，MCP 是插座

图像锚点四层抽屉（工/短/中/长期）+ 插座板插 SQL、RAG、工单

拆解四层=工作→短期→中期→长期 · 面试答法收敛三层（会话/业务库/偏好）· MCP=统一协议，国能用 Dify 工具节点

迷你口诀MCP 产品 → 清单·说明书·监控·安全·确认

块 2-1 · Agent 长期记忆 / Agent Memory（必背）

问法：「你们 Agent 有记忆吗？」「如果要跨会话记住用户，你怎么做？」

【先背 · 30 秒 · 框架】

Agent 记忆我一般分四层来讲：

① 工作记忆：当前这轮对话 + 刚调工具返回的结果，都在 上下文窗口 里，满了就要摘要或丢弃。

② 短期/会话记忆：本会话里用户说过什么、槽位填到哪（工号、部门、时间范围），保留最近 N 轮。

③ 中期记忆（可选）：一个 长任务跨多轮 但还没结束，比如缺陷跟踪「上次催办到哪了」——用 任务 ID + 状态表 存，不必塞进模型脑子。

④ 长期记忆（跨会话）：再拆两种——情景记忆（某次具体事件，带时间）；语义记忆（稳定偏好和事实，比如「默认查近 30 天」「喜欢表格展示」）。长期记忆要 写入时抽取摘要、向量或结构化入库；读取时检索相关片段注入 Prompt，还要有 过期/删除/用户可导出。

【再背 · 2 分钟 · 面试主力答法（ToB + 国能实线）】

💬 你可以这样答

我会把记忆分成三层，不会一上来就让大模型「记住用户一切」。

第一层：短期记忆（会话内）

就是这一轮对话里，用户说了什么、Agent 查到了什么、执行到哪一步。做法通常是 保留最近 N 轮对话 + 关键槽位，比如工号、部门、时间范围、当前工单号。我在 人事 NL2SQL、缺陷跟踪 里主要用这套，够应对连续追问。

第二层：业务记忆（推荐 ToB 默认用这个）

我不建议让模型「脑记」业务数据，而是 系统查业务库：上次工单状态、考勤结果，用 用户 ID / 工号 关联查询。这样 更准、可审计、也好做权限。国能央企场景，我们 跨会话长期记忆没上线，很大原因是 隐私、等保、审计；用业务库替代，效果上用户该查到的还是能查到。

第三层：产品长期记忆（用户偏好）

比如用户喜欢表格展示、常问的三类问题、默认时间范围——这才需要 单独存 User Profile。产品设计时我会先定四件事：

记什么：只记和产品相关的偏好，不记敏感原文
不记什么：薪资、处分、未授权字段一律不进入记忆
记多久：过期自动删；用户可 查看、导出、删除（对齐个保法）
怎么用：每次对话 检索相关记忆片段注入 Prompt，而不是把全部历史聊天记录塞进去

和研发的分工：Profile 表结构、加密、检索策略研发实现；我出 PRD：字段、授权流程、兜底话术、评估指标。

怎么评估：看 用户是否少重复说一遍、任务成功率是否提升；还要看 误记率、隐私投诉——长期记忆记错了比没有记忆更伤。

收尾（诚实 + 自信）：

国能项目因合规 没上第三层；若贵司要做，我可以按上面框架从 小范围试点 开始，比如只记「默认查询时间范围」，验证后再扩。

块 2-2 · MCP（必背）

问法：「了解 MCP 吗？」「我们工具很多，怎么接 Agent？」

💬 你可以这样答

MCP（Model Context Protocol）可以理解成 大模型连接外部工具的「统一插座」。以前接日历、数据库、企业微信，每家一套接口；MCP 让工具以 标准 Server 形式暴露，模型通过协议调用， 便于扩展和治理。

国能现场：我主要用 Dify 的工具节点、HTTP 插件、代码节点，没有以 MCP 名义上线，但 产品职责是一样的——定义 Agent 能调哪些工具、输入输出 Schema、超时重试、权限和审计。

如果贵司要上 MCP，我作为 AI PM 会做这些事：

工具清单：哪些给 Agent 用，哪些不给（最小权限）
每个工具的「产品说明书」：干什么、失败提示、是否需用户确认
和现有编排的关系：Dify/自研 Agent 框架里 MCP Server 怎么注册
Bad Case 与监控：哪个工具调用失败最多、Latency 如何
安全：敏感工具必须 Human-in-the-loop 或二次鉴权

诚实边界：我 还没在生产环境主导 MCP 选型，但 6 个 Agent 的工具编排、降级、复盘我都做过， 迁到 MCP 主要是工程协议层变化，产品方法论是通的。入职后我会优先熟悉贵司现有 MCP 规范和一条业务线试点。

【口诀·块3】不念给面试官 · 先口诀再扩绿条

口诀人事秒级查数，制度零编造答

图像锚点数据库+五把锁（NL2SQL）· 制度书+放大镜+禁止符（RAG 零编造）

拆解NL2SQL=只读SQL+五层安全+FAQ · 成功率≥95%、咨询降约70%、秒级 · RAG=没检索不答+准确率≥95%

练法各 1 分钟稿脱稿各录一遍，追问只扫 bullet 不背全文

面试说「介绍一个项目」→ 优先讲这两个。背熟下面两段 1 分钟稿，追问扫一眼即可。

块 3-1 · 企业人事智能查询 · NL2SQL（2025.11—2026.02）⭐ 建议主力

1 分钟：

员工以前查人事数据要找 HR，口头描述需求，HR 再查系统，慢而且占人力。我用 Dify 搭了 NL2SQL Agent，员工用自然语言提问，系统生成 只读 SQL 查人事库，再用白话总结。安全上做了五层：参数校验、FAQ 分流、SQL 拦截、只读库、行级权限。高频问题走 FAQ 本地匹配，Token 成本降了 60% 以上。上线后 HR 咨询量降约 70%，查询 成功率 ≥95%，基本秒级返回。

追问 · 口语答：

SQL 注入和数据安全？

只用 只读账号；执行前拦截 delete、update、drop 等；SQL 在代码节点里校验；敏感字段按 员工/部门负责人/管理员 三级权限；操作有审计日志。

业务人员说的黑话、口语部门名怎么懂？

维护 业务别名表和口径字典，Bad Case 里口语化问题会反哺这张表；口径变更时 改字典、灰度验证，尽量不动代码。

和 ChatBI 有什么区别？

我们 限定人事域，强合规、强权限，不是开放分析平台；目标是 HR 咨询降负，不是随便拖表。

举一个不满意的 Bad Case？

比如用户说「综合部人数」，系统映射错部门 → 我们补别名、加确认话术「您指的是 XX 部门吗？」→ 回归测试同类问法。

块 3-2 · RAG 制度智能问答（2025.08—2026.02）⭐ 建议主力

1 分钟：

央企制度多、更新快，员工常问 HR。用 RAG 做制度问答，准确率 ≥95%，制度相关咨询 降约 70%，目标是 零编造——没有检索就不答。制度更新走 增量入库；长文档 分段检索 + 多轮。

追问：注入攻击 → 输入过滤 + 审计；怎么证明没瞎编 → 引用制度片段 + 抽检 + 幻觉率指标。

【口诀·块4】不念给面试官 · 先口诀再扩绿条

口诀RAG十二、SQL八、Agent十五、Prompt十、通用十、工具五

图像锚点六格卡片盒 — 📚RAG · 🗄️NL2SQL · 🤖Agent · 📜Prompt · 👥通用 · 🖱️工具

拆解1～12 RAG · 13～20 NL2SQL · 21～35 Agent · 36～45 Prompt · 46～55 通用 · 56～60 工具

练法每次 1 分类约 10 题 大声答；答不上先分清国能/简历，再回块 2/3

格式见文首「本稿格式」：粗体=题号 · 正文=要背的口语 · 斜体=不用背

建议练习顺序（和块 2、3 最贴）： ① 二、NL2SQL（13～20） → 接块 3-1 人事 ② 一、RAG（1～12） → 接块 3-2 制度 ③ 三、Agent（21～35） → 接块 2 Agent 记忆/MCP ④ 再练 四、Prompt（36～45） · 五、通用（46～55） · 六、工具简历（56～60） 不必 60 题全文背诵，每次大声答 10 题即可。

题 1～12

一、RAG 与知识库（1～12）

题 13～20

二、NL2SQL 与数据 Agent（13～20）

题 21～35

三、Agent 与工具（21～35）

题 36～45

四、Prompt · 模型 · 成本（36～45）

两个 AI 项目别混：国能是 6 款 ToB Agent；AI 简历优化是离职后独立 0-1。

Bad Case 是什么？怎么用？

常夹在幻觉、迭代、和算法协作里问。

就是答错了、用户不满意、业务不认账的真实例子，要记下来当错题本，不能只说「感觉不准再优化」。

怎么用：收集（日志、工单、业务反馈）→ 分类（检索、Prompt、权限、别名、模型）→ 找根因 → 改 → 同一批错题再测，看同类错误有没有降下来。

举例：国能人事口语部门名查不对，就补业务别名表；制度跨章节漏召回，就调 chunk 和混合检索；简历项目夸大经历，就 Prompt 禁止编造并单列一类每周抽检。详表见附3 §6、附10。

制度问答：没检索到就不答，还要带引用。分类和 SQL：低温度、固定 JSON 格式。NL2SQL：拦截危险语句、结果对账。隐患：人工确认后再入库。简历：提交前校验禁止编造。所有场景：错题本改完要回归测。

国能人事高频问走 FAQ 本地匹配，不调大模型，Token 能降六成以上。长对话做缓存或摘要，别重复喂全文。简历项目复杂步骤用标准版、简单步骤用基础版，预算触顶自动降级。还要限流防刷，RAG 只喂相关段，别整库塞进 Prompt。

用 RAG 只检索相关段；多轮对话保留最近几轮加摘要；NL2SQL 只给相关表结构和口径；简历 OCR 合并太长就截断并提示；缺陷跟踪只加载当前工单时间窗，不拉全厂历史。

题 46～55

五、AI 产品经理通用（46～55）

题 56～60

六、Vibe Coding · 工具 · 简历（56～60）

以下 不用按顺序全文背。面试前 30 分钟可扫 附9 考前清单；被问到再翻 附2 定位题、附3 技术词。

【口诀·附2+附3】不念给面试官 · 先口诀再扩绿条

口诀转AI有落地，分工有边界；RAG搜、SQL查、Func调、MCP联

图像锚点三角（国能 / 简历 / 14年ToB）+ 四插头插座板（技术词）

拆解附2=定位6题查阅 · 附3=15技术词点名再翻 · 块1～4背熟后再扫

练法考前30分钟扫口诀+附9；面试中被问再展开，不抢在块1～4前面背

附1 · 面试地图（一场面试四段话用哪一块）

面试官在问什么	用哪一块
自我介绍 / 为什么转 AI PM	块 1 + 附2
Agent 记忆、MCP、ReAct、怎么设计	块 2 + 附4
介绍项目、RAG、NL2SQL、Bad Case	块 3 + 附5
概念题、RAG 流程、Prompt、成本	块 4 + 附3
行为面、离职原因、挑战	附7
反问	附8

附2 · 定位类 6 题

1. 为什么转 AI 产品经理？

问法：你为什么做 AI PM？是不是跟风？

💬 你可以这样答

我不是去年才开始接触 AI。之前十几年一直在做 ToB，ERP、OA、人事系统、数据治理都做过，擅长把业务流程和产品落地。2025 年 5 月起在国能肇庆，我从 0 参与设计了 6 款 Agent 上线，制度 RAG、人事和燃料 NL2SQL、培训出题、隐患派单、缺陷跟踪都有，从需求、工作流、Prompt、评估到 Bad Case 复盘我都负责。2026 年又独立做了 C 端 AI 简历产品，PRD、原型、运营后台、研发交接都走完了。所以转 AI PM 是有项目支撑的，不是只看热闹。

2. 你和算法 / 后端怎么分工？

问法：AI 产品和技术怎么配合？你会不会只是写 PRD？

💬 你可以这样答

我定场景、用户路径、成功指标，还有 Prompt 和工作流怎么编排、什么必须人工审核、Bad Case 怎么闭环。算法和后端负责模型选型、向量库、SQL 引擎、权限和性能。我开发出身，能看懂接口和日志，联调时不会对扯皮。举个例子：人事 NL2SQL 里「部门口语化查不对」，我会和研发一起看是别名表问题还是 Prompt 问题，改完用同一批测试题验证，而不是只说「效果不好再优化」。

3. 你学的是不是皮毛？抖音那些 Agent 记忆、MCP 你懂吗？

问法：感觉 AI 变化很快，你跟得上吗？

💬 你可以这样答

我不靠背论文，我靠落地。每个 Agent 都有准确率、自助化率、Token、幻觉这些指标，还有每周抽检和 Bad Case 表。抖音上的 Agent 记忆、MCP，我理解概念，也清楚产品该怎么设计——国能因为央企合规，跨会话长期记忆我们没上，用的是业务库加会话上下文；MCP 我现场用 Dify 工具节点，原理一样。如果贵司要用 MCP 或长期记忆，我可以按 块 2 那套思路讲怎么设计，和我现有经验是接得上的。

4. 2018 年以前的 ERP 还要讲吗？

问法：你简历很长， oldest 的项目和 AI 有什么关系？

💬 你可以这样答

老项目证明我有 ToB 基本功：复杂流程、多组织、数据口径、跨系统集成、带团队。AI 能力从 2025 年 5 月 国能 Agent 才开始写。面试时老项目我讲数字化成果；AI 细节只绑 Agent 和 C 端简历，不会把 ERP 说成 AI 项目。

5. 期望薪资 30～35K 的依据？

问法：你的期望为什么是这个区间？

💬 你可以这样答

结合广州市场和岗位：14 年 ToB 产品经验、带团队、研发背景，加上近一年 6 款 Agent 从 0 到上线，以及 C 端 0-1 的 PRD 和原型交付。我更看 能力匹配 和 能独立负责 AI 场景，具体可以聊。

6. 你日常用哪些 AI 工具？（抖音常问）

问法：你平时用什么 AI 工具？

💬 你可以这样答

工作流编排用 Dify 做 Agent；产品验证用 Cursor 做 Vibe Coding，C 端 39 页原型很多是这样快速搭出来再交给研发的；文档和 PRD 用大模型辅助写结构和润色，但业务规则、指标、合规我自己定稿；协作用常规办公和项目管理工具。工具会变，关键是 场景、指标、Bad Case 这套方法不变。

附3 · 技术词查阅（15 个）

用法：面试官 点名某个词 时用本章；若他说「讲讲你做的制度问答」，直接去 第五章 G，别整章背。结构：什么时候答（不用背）→ 正文（要背的口语）→ 结合项目（有则背）→ 常见追问（被追问再看）。 面试官不懂英文时：先说「就是……」人话，再讲项目里哪一步，别只堆 RAG、HITL 等缩写。 项目别混：国能 = 6 款 ToB Agent（文本）；AI 简历优化 = 独立 0-1（含 OCR/多模态）。

1. RAG（检索增强生成）

不用背什么时候答：简历写了制度问答 / 培训出题；或问「怎么防幻觉」「知识库怎么建」。

RAG 就是先查资料再回答。大模型自己编容易瞎说，我们先从制度库、题库里检索相关段落，再让模型只根据检索到的内容组织答案，这样私有知识能更新，幻觉也会少很多。

结合项目：

在国能我做了两个 RAG：制度问答 和 培训出题。制度是按章节切分，有重叠，再向量检索，Prompt 里写死「没有检索结果不许编，要引导找人工」。培训出题是在五大题库里按类别检索，再出题，避免跨类、避免编造。

常见追问 · 口语答：

Chunk 怎么切？

按制度章节或条款切，一段大概 200～500 字，相邻段 重叠 10%～20%，避免一句话被切两半导致搜不到。

召回率低怎么办？

先看是切分问题还是检索问题：可以 混合检索（向量 + 关键词），加 Rerank 精排，调 Top-K；Bad Case 里把「搜不到的问法」收集起来专门测。

没搜到还回答怎么办？

产品规则就是 不许编。返回「未找到相关制度，建议联系 XX 部门」，并留人工入口；这在我们央企场景是硬要求。

怎么评估效果？

看 回答准确率、幻觉率、引用是否命中；每周抽一批问题盲测，业务方也会参与抽检。

2. NL2SQL（自然语言查数）

不用背什么时候答：人事 Agent、燃料 Agent；或问「ChatBI」「Text2SQL」「数据安全」。

NL2SQL 就是员工说人话，系统生成只读 SQL 去查业务库，再用自然语言总结结果。适合考勤、编制、燃料消耗这类结构化数据。

结合项目：

人事和燃料两个 Agent 都是 Dify 工作流。前面有意图识别和业务别名（比如口语「综合部」映射到标准部门名），中间生成 SQL，后面 五层安全：参数校验、FAQ 分流、SQL 危险语句拦截、只读库、行级权限。人事高频问题走 FAQ，Token 能降 60% 以上。

常见追问 · 口语答：

表太多怎么办？

先 限定主题域（人事一套、燃料一套），给模型 Schema 摘要和别名表，不要一次扔几百张表。表特别多时，可以加一步「先推荐 Top 相关表」再生成 SQL——产品上要定义推荐错了怎么兜底。

SQL 错了怎么办？

执行前 语法校验、拦截 delete/update 等；执行后 结果抽样、空结果/异常量告警；错例进 Bad Case，改 Prompt 或补别名，不是只改模型。

和 RAG 有什么区别？

RAG 查文档（制度 PDF、Word）；NL2SQL 查数据库表。我们制度用 RAG，人事编制用 NL2SQL，选型看数据在哪。

3. Function Calling / 工具节点

不用背什么时候答：问 Agent 怎么执行动作、怎么调 API、Dify 里工具节点是什么。

Function Calling 就是模型不只会说话，还能决定调用哪个工具，比如查库、算数、调 HTTP 接口，拿到真实结果再继续推理。在 Dify 里我主要用工具节点和代码节点实现，和 Function Calling 是一类能力。

结合项目：

人事 Agent 里：FAQ 匹配、权限校验、SQL 执行、结果格式化都是节点；隐患 Agent 里输出固定 JSON 给工单系统。产品上要定义 每个工具输入输出、失败怎么办、谁有权限调。

常见追问：

工具调用失败？

重试 1～2 次 → 换降级话术 → 转人工；日志里要能看到 哪一步失败，方便 Bad Case。

和 MCP 什么关系？

MCP 是 接工具的统一协议标准；我在国能用 Dify 插件/HTTP 工具， 产品思路一样。MCP 怎么选型见 块 2-2。

4. Human-in-the-loop（人在回路）

不用背什么时候答：隐患派单、缺陷跟踪；或问「AI 错了谁负责」「央企能不能全自动」。

就是 AI 出建议，人点确认后才生效。安全、派单、涉责场景必须这样，不能 AI 直接改生产数据。

结合项目：

隐患分类 Agent 输出类别、责任部门、紧急程度，审核员确认后才写入 IMS 工单。一开始人工多，准确率高了之后，可以只对 低置信或高风险 强制人工，用 人工介入率 看效率。

追问：会不会很慢？

首月会慢，但相比以前 30 分钟一单，AI 1 分钟出建议、人 2 分钟确认，整体还是快很多；指标上 分类准确率 ≥95% 才逐步放权。

5. 幻觉防控

不用背什么时候答：任何 AI 项目都会问；C 端简历尤其会问「会不会编造经历」。

幻觉就是模型一本正经胡说。产品不能单靠 Prompt 里写请勿编造，要检索约束、格式约束、校验、评估一起上。

结合项目：

制度 RAG：无检索不回答 + 引用来源；NL2SQL：只读库 + 结果对账；分类 Agent：低温度 + JSON Schema；C 端简历：禁止编造经历 + 提交前校验 + Bad Case。目标上关键场景 宁可说不知道，也不编。

6. Bad Case 复盘

不用背什么时候答：问你怎么迭代、怎么和算法协作、效果怎么持续提升；或面试官问「Bad Case 是什么？」（很多人没听过这个词）。

Bad Case，中文你就理解成错题本：答错的、用户不满意的、业务不认账的真实例子。不是骂用户，而是把这些例子当资产，用来改产品。

怎么用（五步，面试可直接说）：

收集（日志、工单、HR/业务反馈）→ 分类（检索 / Prompt / 权限 / 别名口径 / 模型）→ 找根因 → 改（补别名表、调 chunk、改 Prompt、加校验）→ 同一批错题再测一遍，看同类错误率有没有下来。

结合项目（先说归属）：

国能·人事：「口语部门名查不对」→ 补 业务别名表
国能·制度：「跨章节漏召回」→ 调 chunk + 混合检索
AI 简历优化：「夸大/虚构经历」→ Prompt 禁止编造 + Bad Case 单列一类 每周抽检

和算法怎么协作：你带 错题列表 + 指标 开会，不用「感觉不准」；改完必须 回归同一批题。详表见 附10 各项目 Bad Case 分类。

7. 效果评估

不用背什么时候答：问 KPI、上线后怎么盯、和老板怎么汇报。

我分三层：技术层（准确率、幻觉率、延迟、SQL/JSON 合规率）、产品层（自助化率、查询成功率、人工介入率）、业务层（咨询量降多少、审核量降多少、决策快多少、Token 花多少）。

结合项目：

制度/人事 咨询量降约 70%，NL2SQL 成功率 ≥95%，隐患分类 ≥95%。上线后有 日报 + 每周抽检 + 月度业务复盘，指标掉下去当天就要查。

8. Prompt 工程 + 版本回退

不用背什么时候答：问和微调怎么选、Prompt 怎么写、线上出问题怎么回滚。

Prompt 就是给模型的岗位说明书：你是谁、干什么、不能干什么、输出什么格式。企业里还要能版本管理、能 5 分钟生效、出问题能一键回退——我在 C 端 PRD 和 B 端原型里都设计了提示词配置和回退。

和微调怎么选（口语）：

知识常变、要快迭代 → Prompt + RAG 优先；格式极其固定、数据量很大、Prompt 顶不住 → 再考虑微调。国能 6 个 Agent 和 C 端简历，都以 Prompt + 工作流为主。

9. Token / 成本治理

不用背什么时候答：问商业化、C 端怎么控本、企业怎么降 API 费用。

大模型按 Token 计费，产品要想少调用、用小模型、缓存、分流。

结合项目：

人事 Agent：FAQ 本地匹配，高频问题不调大模型，Token 降 60%+。C 端简历：模型分档，复杂用标准版、简单用基础版，预算触顶 自动降级，界面上 不暴露模型名，只显示「标准版/基础版」。

10. Vibe Coding（Cursor）

不用背什么时候答：问你会不会用 AI 写代码、原型谁做的、和研发边界。

Vibe Coding 是产品经理用 AI 编程助手快速搭原型、验证交互和规则，不是替代正式研发。我用 Cursor 做 C 端 39 页 + B 端运营后台可点原型，对齐 PRD 和 dev-spec，研发接手时有接口和验收标准；公开链接因保密只放 C 端，后台面试可展示。

抖音说的「五层能力」（口语）：

① 需求边界（PRD 里 AI 能做什么不能做什么）② Prompt 和规则 ③ 工作流和页面 ④ 异常兜底（超时、失败不扣点）⑤ 评估和 Bad Case。我 ①②④⑤ 都做过；正式上线 安全、性能、合规 仍要研发工程化。

11. Context Window（上下文窗口）

不用背什么时候答：问对话太长怎么办、制度很长怎么塞进去。

就是模型一次能读多长的内容，有上限。所以长制度不能整本塞进 Prompt，要用 RAG 只喂相关段；多轮对话用最近几轮加摘要；缺陷 Agent 只加载当前工单时间窗的信息。

12. Dify 工作流

不用背什么时候答：问你们技术栈、Agent 怎么编排。

Dify 是可视化把意图识别、检索、SQL、校验、生成串成一条链。6 个 Agent 各有一条主流程，共性节点包括：FAQ 分流、权限、异常分支、转人工。

13. AI 治理（安全 / 合规 / 成本）

不用背什么时候答：ToB、央企、C 端小程序合规。

AI 上线不只看准不准，还要看权限、审计、内容安全、成本上限。国能：只读库、SQL 注入防护、三级人事权限、操作留痕；C 端：深度合成相关合规、失败不扣能量点、分享打码等。

14. 多模态 / OCR（图片·文档·摄像头）

不用背什么时候答：问「多模态了解吗」「简历能不能传图」「OCR 谁做」。

查阅口语 30 秒：见块 4 第 43 题（背那一段即可）。查阅提示：OCR/多模态在 AI 简历优化；国能 6 个 Agent 是纯文本，口头不必对比。

附4 · 设计题 10 问（块2已背 1～2，其余查阅）

这类题 HR 和业务都会问：「我们将来要做 XXX，你会怎么设计？」 答法结构：① 先说概念（30 秒）② 说你会怎么设计（1～2 分钟）③ 诚实说国能为什么没做/你用什么替代 ④ 接一句「和我现有 Agent 经验相通」。

必背1. Agent 长期记忆怎么设计？（抖音超高频 · 必背）

🧠 Agent 记忆 · 四层框架（先背 30 秒版）

④ 长期记忆情景+语义 · 跨会话 · 要过期删除
③ 中期记忆长任务 · 任务ID+状态表
② 短期/会话最近N轮 + 槽位
① 工作记忆当前轮 + 工具返回 · 在上下文里

ToB 面试答法 → 收敛为三层：会话内 · 业务库 · 用户偏好

问法：「你们 Agent 有记忆吗？」「如果要跨会话记住用户，你怎么做？」

💬 你可以这样答

我会把记忆分成三层，不会一上来就让大模型「记住用户一切」。

第一层：短期记忆（会话内）

第二层：业务记忆（推荐 ToB 默认用这个）

第三层：产品长期记忆（用户偏好）

比如用户喜欢表格展示、常问的三类问题、默认时间范围——这才需要 单独存 User Profile。产品设计时我会先定四件事：

记什么：只记和产品相关的偏好，不记敏感原文
不记什么：薪资、处分、未授权字段一律不进入记忆
记多久：过期自动删；用户可 查看、导出、删除（对齐个保法）
怎么用：每次对话 检索相关记忆片段注入 Prompt，而不是把全部历史聊天记录塞进去

和研发的分工：Profile 表结构、加密、检索策略研发实现；我出 PRD：字段、授权流程、兜底话术、评估指标。

怎么评估：看 用户是否少重复说一遍、任务成功率是否提升；还要看 误记率、隐私投诉——长期记忆记错了比没有记忆更伤。

收尾（诚实 + 自信）：

国能项目因合规 没上第三层；若贵司要做，我可以按上面框架从 小范围试点 开始，比如只记「默认查询时间范围」，验证后再扩。

2. MCP 是什么？你们用过吗？如果要用你怎么做？

问法：「了解 MCP 吗？」「我们工具很多，怎么接 Agent？」

💬 你可以这样答

如果贵司要上 MCP，我作为 AI PM 会做这些事：

工具清单：哪些给 Agent 用，哪些不给（最小权限）
每个工具的「产品说明书」：干什么、失败提示、是否需用户确认
和现有编排的关系：Dify/自研 Agent 框架里 MCP Server 怎么注册
Bad Case 与监控：哪个工具调用失败最多、Latency 如何
安全：敏感工具必须 Human-in-the-loop 或二次鉴权

3. ReAct 是什么？和你们 Dify 工作流一样吗？

💬 你可以这样答

ReAct 是 Reason（推理）→ Act（行动）→ Observe（观察结果） 再循环，直到任务完成。比如：先想「要查人事库」→ 调 SQL 工具 → 看结果不对 → 改条件再查。

Dify 工作流可以是 固定流程，也可以是 带分支的多步，和 ReAct 思想接近。我的 隐患、缺陷 Agent 更接近「多步 + 工具」； 制度 RAG 更像固定链：检索 → 生成。面试里我会说：不是所有场景都要强 Agent，问答类 RAG 够用就行， 派单、跟踪类才上 ReAct 式编排。

4. RAG 和 Agent 有什么区别？你们为什么两个都做？

💬 你可以这样答

RAG 解决 「知识从哪来、怎么别瞎编」，典型是制度问答、培训出题。

Agent 解决 「多步完成任务、调工具、有状态」，典型是隐患派单、缺陷催办。

可以这么记：RAG + 对话是弱 Agent；我们 隐患、缺陷是强 Agent。选型看用户要完成 一步问答 还是 一条业务链路。

5. 混合检索、Rerank 是什么？产品上要关心吗？

💬 你可以这样答

向量检索 懂语义，但有时漏关键词；关键词/BM25 对制度编号、专有名词更准。混合检索 就是两个一起用再合并结果。Rerank 是用一个小模型对 Top 结果 再排一次序，提高「喂给大模型的段落」质量。

产品上要定：召回不够时先调检索还是调 Prompt；Bad Case 里要标 是检索错还是生成错——这决定改知识库还是改模型参数。

6. Agent 怎么评估？除了准确率还看什么？

💬 你可以这样答

除了 任务成功率、回答准确率，我还看：

步数/耗时：Agent 是否绕圈
人工介入率：多少单必须人点确认
工具调用成功率
Grounding：回答是否真有检索/SQL 依据
业务结果：派单是否更快、咨询是否减少

C 端还会看 完成率、留存、单次 Token 成本。

7. Agent 死循环 / 越跑越偏怎么办？

💬 你可以这样答

产品规则上设 最大步数、总超时、重复检测（同一步骤重复 3 次就停）；给用户 明确失败提示和转人工；日志里记录 每一步决策，方便 Bad Case。不会让用户对着屏幕干等。

8. 多 Agent 协作 / 主 Agent 拆子 Agent 你怎么想？

💬 你可以这样答

按 业务域拆，比如「人事 Agent」「燃料 Agent」分开，不要一个 Agent 包打天下——我们国能就是这么做的。若要做「总前台」，可以是 路由 Agent 先识别意图再 分发给子 Agent，产品上要定义 交接上下文带哪些字段、失败谁兜底。

9. RAG 知识库怎么构建？（抖音：骆齐那类题）

💬 你可以这样答

① 收资料：制度、题库、FAQ，定 owner 和更新频率

② 清洗：去重、去密、版本号

③ 切分：按章节/条款，控制长度和 overlap

④ 向量化入库

⑤ 试检索 + 试回答，用 Bad Case 调 chunk 和检索策略

⑥ 上线后增量更新，不是一次完事

制度更新时我们走 增量入库，不是整库推翻重来。

必背10. AI 问答不准，你怎么排查？（通用排查五步法 · 必背）

💬 你可以这样答

我固定五步，不和研发瞎猜：

检索有没有——该搜到的搜到了吗？
Prompt 有没有用检索——是不是模型没用上片段？
模型参数——温度是不是太高？
权限和数据——是不是用户根本没权限看这条数据？
Bad Case 是否重复——同类错误进表，改完回归

这五步在国能 每周复盘 都会用。

附5 · 全部项目（块3已背 B+G，其余查阅）

用法：面试官说「介绍一个项目」→ 选 2 个主力（建议 人事 NL2SQL + 制度 RAG，或 隐患 HITL + C 端简历）背熟 1 分钟稿；其余项目 知道 30 秒版 即可。

A. C 端 · AI 简历优化助手（2026.02—至今）

1 分钟（可直接念）：

这个项目是给求职者用的 AI 简历助手，目标是用大约 15 分钟 走完摸底、初稿、JD 对齐、HR 预览到导出 PDF。我独立完成了 PRD v1.3.2，里面单独写了 AI 能力专章，包括能力边界、输入输出、质量指标、评测方法和成本安全；还做了 39 页 C 端可交互原型 + 全模块 B 端运营后台原型（用户/交易/内容/增长/数据与风控等），以及含 接口、字段、JSON 示例、验收路径 的研发交接文档。原型阶段用 Cursor 做 Vibe Coding，C 端和后台规则都是先验证再交给研发。公开演示链接因保密只展示 C 端；后台面试可现场展示。合规上按微信小程序 深度合成 相关要求做了评估，设计了失败不扣点、分享打码等规则。

追问 · 口语答：

PRD 里 AI 专章写什么？

写清楚 能做什么、不能做什么；每个 AI 能力的输入输出；准确率/完成率等指标；怎么评测；Token 和模型分档；失败和超时怎么处理。研发不能猜。

怎么防编造简历经历？

Prompt 禁止编造 + 提交前校验 + 用户确认；Bad Case 里专门有一类「夸大/虚构」；宁可提示用户补充，也不自动编一段假经历。

成本怎么控？

模型分档，复杂步骤用标准版，简单用基础版；预算触顶自动降级；后台可看单次和日均 Token；用户界面 不暴露模型名。

Vibe Coding 和研发边界？

我用 Cursor 做 原型和规则验证；上线版本的 安全、性能、支付、合规 必须研发工程化，我交付 PRD、原型、接口和 Done 定义。

为什么链接里只有小程序？后台做了吗？

做了 全模块 B 端运营后台（留言退款、用户 360°、SKU/订单、课程 CMS、提示词/文案、增长、审计风控等），每页带 接口与验收说明。公开链接受保密只展示 C 端；面试可 现场打开后台原型 或按模块口述。

多模态 / 上传简历图 / OCR 做了吗？

做了，在 AI 简历优化里：摸底和 JD 可传图 OCR，图会压缩，失败不扣点；还有留言附图和表情摄像头。口语直接背块 4 第 43 题。

必背B. 企业人事智能查询 · NL2SQL（2025.11—2026.02）⭐ 建议主力

🛡️ 人事 NL2SQL · 五层安全（必记）

参数校验
FAQ 分流
SQL 拦截
只读库
行级权限

高频走 FAQ → Token 降 60%+ · 成功率 ≥95%

1 分钟：

追问 · 口语答：

SQL 注入和数据安全？

只用 只读账号；执行前拦截 delete、update、drop 等；SQL 在代码节点里校验；敏感字段按 员工/部门负责人/管理员 三级权限；操作有审计日志。

业务人员说的黑话、口语部门名怎么懂？

维护 业务别名表和口径字典，Bad Case 里口语化问题会反哺这张表；口径变更时 改字典、灰度验证，尽量不动代码。

和 ChatBI 有什么区别？

我们 限定人事域，强合规、强权限，不是开放分析平台；目标是 HR 咨询降负，不是随便拖表。

举一个不满意的 Bad Case？

比如用户说「综合部人数」，系统映射错部门 → 我们补别名、加确认话术「您指的是 XX 部门吗？」→ 回归测试同类问法。

C. 燃料数据分析 · NL2SQL（2025.11—2026.02）

🛡️ 人事 NL2SQL · 五层安全（必记）

参数校验
FAQ 分流
SQL 拦截
只读库
行级权限

高频走 FAQ → Token 降 60%+ · 成功率 ≥95%

1 分钟：

燃料成本分析以前靠人工导数、做表，动辄 小时级。这个 Agent 用 NL2SQL 查燃料数据，并给 分析建议，响应秒级，帮助成本优化大约 2%～5%。架构和人事类似，但 成本数据更敏感，行级权限和脱敏更严。

追问：敏感数据 权限 + 脱敏 + 审计；口语指标名 意图分类 + 标准词库；数据量大 索引、分页、复杂查询降级。

D. 培训出题 · RAG（2025.10—2026.02）

1 分钟：

五大类题库用 RAG 检索 + 分类 Prompt 自动出题，准确率 ≥98%，出题效率提升约 90%。规则是 无检索不出题，避免模型凭空编题；内容有 敏感词过滤和抽检。

追问：防跨类 → 检索带类别标签 + Prompt 锁类别；题库更新 → 增量入库。

必背E. 隐患分类与派单 Agent（2025.09—2026.02）⭐ 建议备选一个

1 分钟：

现场隐患以前 30 分钟 才能分类派单。这个 Agent 不用知识库，靠 强规则 Prompt 输出 固定 JSON（类别、责任部门、紧急程度），审核员 确认后才写入工单——典型 Human-in-the-loop。分类 准确率 ≥95%，整体 1 分钟级。

追问：为什么必须人工确认 → 央企安全责任，AI 不能直接改生产工单；JSON 怎么对接 → Schema 固定 + 和 IMS 的适配层。

F. 缺陷闭环跟踪 Agent（2025.08—2026.02）

1 分钟：

跟踪缺陷工单状态，识别逾期，自动催办。缺陷处理周期缩短约 40%，逾期率降约 60%。催办话术和时段 可配置，避免半夜打扰。

必背G. RAG 制度智能问答（2025.08—2026.02）⭐ 建议主力

📚 RAG 一句话流程

收文档→切块→ 向量化→检索→生成

制度类：没检索到 = 不许编

1 分钟：

追问：注入攻击 → 输入过滤 + 审计；怎么证明没瞎编 → 引用制度片段 + 抽检 + 幻觉率指标。

H. 国能 IMS 智慧电厂（数字化 · 非 LLM）

30 秒：

这是 15 大模块的数字化平台，数据中台、千人 100% 使用。 AI Agent 是同期独立做的 6 个子项目，不要混成「整个 IMS 都是大模型」。

I. 金不换 ERP / 谦玛 HR（备用）

30 秒：

金不换是集团 业财一体 ERP，分公司从 24 扩到 32 家；谦玛做过 人事 11 模块 0-1 的传统 HR 系统。2025 年 才把人事查询做成 NL2SQL Agent，老系统经验是 数据和流程功底，不是 LLM。

不用背ERP 若深挖：最难是 多分公司口径统一；用 BPR + 标准产品 + RICE 砍定制；和金蝶税友 标准接口 + 字段映射。

附6 · 大模型基础

上下文窗口：模型一次能读多长的内容；太长就要 RAG 或摘要，不能硬塞。

对齐（Alignment）：让模型输出符合人类价值观和安全要求；RLHF 是常见训练手段，产品侧更多关注 上线后边界和评测。

基座 / 微调 / Prompt：基座是通用大模型；微调用数据改模型权重；Prompt 是改指令—— 我们项目以 Prompt + RAG 为主，迭代最快。

零样本 / 少样本：不给例子或给几个例子在 Prompt 里；分类、格式控制里常用 少样本示例。

涌现：模型变大后偶发新能力；产品上 少吹概念，多测场景。

不用背Transformer / 注意力：知道是主流架构即可；面试 不必展开数学，被问就说「了解原理，工作重心在场景和评测」。

附7 · 行为面

最大挑战：C 端要在 效果和 Token 成本 间平衡 → 模型分档和降级；B 端要在 效率和安全 间平衡 → Human-in-the-loop。

失败或延期：ERP 早期定制过多导致延期 → 后面用 标准产品 + RICE 砍需求，这个思路也用在 AI：先 MVP 一个场景，再扩。

跨部门协调：国能做过 6 部门访谈、12 场培训，IMS 使用率 100%；AI 项目同样要先 对齐指标和合规 再推。

和研发分歧：用 Bad Case 列表和指标 对齐，不用「感觉不准」；我懂技术，能一起查日志。

为什么离开/看机会：按真实情况说；可强调 已完成国能 Agent 交付，希望在 AI PM 方向持续深耕。

年龄 / 35 岁 / 1990 年：见 块 1「年龄偏大」追问——AI 专业能力 + 业务落地/管理/交付/沟通（与年轻人互补）；收尾可接「考我某个 Agent 怎么拆工作流」。

项目只有 C 端链接：见 块 1「后台呢」追问——C+B 全模块原型 + 接口文档；保密原因未公开后台，面试可展示。

附8 · 反问

贵司 AI 产品是 自研编排还是 Dify/Coze 这类平台？我入职后大概多久能独立负责一条 Agent 线？
当前 最想解决的 1 个 AI 场景 是什么？成功指标怎么定？
AI 产品和算法/后端 多久做一次 Bad Case 复盘？
未来半年更偏 B 端 Agent 还是 C 端应用？和我经历哪块更匹配？

附9 · 考前 30 分钟清单

块 1 自我介绍 120 秒顺读 1 遍 · Dify / 年龄 / 后台链接 三个追问各过 1 遍
块 2-1 Agent 记忆（先 30 秒四层框架，再 2 分钟国能答法）各 1 遍
块 2-2 MCP 读 1 遍
块 3 人事 NL2SQL + 制度 RAG 1 分钟稿 各读 1 遍
块 4 任选一个分类（建议 NL2SQL 13～20 或 RAG 1～12）大声答 5～10 题 · 40～43 题各用「人话+项目」说 1 遍（勿只堆名词）
附3 RAG、NL2SQL、Bad Case（先翻译「错题本」）、多模态 §14 各口语说 30 秒
口径：2025.05 前不讲 AI 项目 · OCR/多模态只讲 AI 简历优化

附10 · 项目深挖 Bad Case

以下为你原稿中 燃料/培训/隐患/缺陷/制度/ERP 的「基础追问+进阶深挖+Bad Case 分类」，内容有效，不必全背，面试前按项目 扫一眼粗体问题 即可。

燃料 NL2SQL · 进阶（节选）

分库分表 → 数据源路由
亿级数据 → 索引+分页+复杂查询降级
敏感成本 → 行级权限+脱敏+审计

培训 RAG · Bad Case 分类

检索 50% / Prompt 30% / 知识库 15% / 模型 5%
优化：重分段、调检索、禁止编造、增量更新

隐患 Agent · Bad Case 分类

术语 40% / Prompt 35% / 边界 20% / 格式 5%

缺陷 Agent · Bad Case 分类

Prompt 45% / 定义 30% / 上下文 20%

制度 RAG · Bad Case 分类

检索 50% / Prompt 25% / 知识库 20%

金不换 ERP · 高频 13 问

最难：24 家分公司口径统一
BPR：四大流程去冗余上线
微服务：模块独立迭代
金蝶税友：标准接口+字段映射
成果：数据互通、流失率降、32 家分公司

文档版本：2026-06 · 口语版 v2 · 对齐 马凯强-AI产品经理 (3).pdf · 含 Agent 记忆/MCP 设计题 · 必考 60 题

文档版本：2026-06 · 口语版 v3 · 背诵顺序版 · 抖音 Agent Memory 已并入块 2-1

自我介绍 · 第 1 天（约 5 分钟）

块 1 · 120 秒自我介绍（必背 · 可直接念 · 对齐简历）

常见追问：为什么用 Dify，不做一个「AI 对话框」让用户直接问？

常见追问：年龄偏大 / 1990 年 / 35 岁还做 AI 产品吗？

常见追问：项目链接里怎么只有小程序，后台呢？

Agent 记忆 + MCP · 第 1～2 天

块 2-1 · Agent 长期记忆 / Agent Memory（必背）

块 2-2 · MCP（必背）

两个主力项目 · 第 2～3 天（各 1 分钟）

块 3-1 · 企业人事智能查询 · NL2SQL（2025.11—2026.02）⭐ 建议主力

块 3-2 · RAG 制度智能问答（2025.08—2026.02）⭐ 建议主力

必考题 60 题 · 第 3 天起（每次约 10 题）

一、RAG 与知识库（1～12）

二、NL2SQL 与数据 Agent（13～20）

三、Agent 与工具（21～35）

四、Prompt · 模型 · 成本（36～45）

五、AI 产品经理通用（46～55）

六、Vibe Coding · 工具 · 简历（56～60）

块 1～4 背熟后再看 · 查阅 / 加餐

附1 · 面试地图（一场面试四段话用哪一块）

附2 · 定位类 6 题

1. 为什么转 AI 产品经理？

2. 你和算法 / 后端怎么分工？

3. 你学的是不是皮毛？抖音那些 Agent 记忆、MCP 你懂吗？

4. 2018 年以前的 ERP 还要讲吗？

5. 期望薪资 30～35K 的依据？

6. 你日常用哪些 AI 工具？（抖音常问）

附3 · 技术词查阅（15 个）

1. RAG（检索增强生成）

2. NL2SQL（自然语言查数）

3. Function Calling / 工具节点

4. Human-in-the-loop（人在回路）

5. 幻觉防控

6. Bad Case 复盘

7. 效果评估

8. Prompt 工程 + 版本回退

9. Token / 成本治理

10. Vibe Coding（Cursor）

11. Context Window（上下文窗口）

12. Dify 工作流

13. AI 治理（安全 / 合规 / 成本）

14. 多模态 / OCR（图片·文档·摄像头）

附4 · 设计题 10 问（块2已背 1～2，其余查阅）

必背1. Agent 长期记忆怎么设计？（抖音超高频 · 必背）

2. MCP 是什么？你们用过吗？如果要用你怎么做？

3. ReAct 是什么？和你们 Dify 工作流一样吗？

4. RAG 和 Agent 有什么区别？你们为什么两个都做？

5. 混合检索、Rerank 是什么？产品上要关心吗？

6. Agent 怎么评估？除了准确率还看什么？

7. Agent 死循环 / 越跑越偏怎么办？

8. 多 Agent 协作 / 主 Agent 拆子 Agent 你怎么想？

9. RAG 知识库怎么构建？（抖音：骆齐那类题）

必背10. AI 问答不准，你怎么排查？（通用排查五步法 · 必背）

附5 · 全部项目（块3已背 B+G，其余查阅）

A. C 端 · AI 简历优化助手（2026.02—至今）

必背B. 企业人事智能查询 · NL2SQL（2025.11—2026.02）⭐ 建议主力

C. 燃料数据分析 · NL2SQL（2025.11—2026.02）

D. 培训出题 · RAG（2025.10—2026.02）

必背E. 隐患分类与派单 Agent（2025.09—2026.02）⭐ 建议备选一个

F. 缺陷闭环跟踪 Agent（2025.08—2026.02）

必背G. RAG 制度智能问答（2025.08—2026.02）⭐ 建议主力

H. 国能 IMS 智慧电厂（数字化 · 非 LLM）

I. 金不换 ERP / 谦玛 HR（备用）

附6 · 大模型基础

附7 · 行为面

附8 · 反问

附9 · 考前 30 分钟清单

附10 · 项目深挖 Bad Case

燃料 NL2SQL · 进阶（节选）

培训 RAG · Bad Case 分类

隐患 Agent · Bad Case 分类

缺陷 Agent · Bad Case 分类

制度 RAG · Bad Case 分类

金不换 ERP · 高频 13 问