马凯强 · 面试背诵稿(从上到下背 · 2026)
对齐简历:马凯强-AI产品经理 (3).pdf · 目标:面试拿 offer 用法:从下一行开始,严格从上到下背。 背完 块 1→2→3→4 再翻第二阶段。
本稿格式(块 4 及问答区统一)
| 样式 | 什么意思 |
|---|---|
| 粗体 | 题号、小节名、关键数字——扫一眼即可,不必整句背 |
| 正文 | 要背的口语,面试里直接照着说 |
| 斜体 | 提示、不用背、心里记住、跳转到别章 |
| 【口诀】 | 背稿脚手架(口诀→图像锚点→再扩绿条口语)——面试不念 |
背诵路线图(就按这个顺序)
| 顺序 | 块 | 内容 | 时间 |
|---|---|---|---|
| 1 | 块 1 | 自我介绍 120 秒(含常见追问:Dify · 年龄 · 后台原型) | 第 1 天 |
| 2 | 块 2 | Agent 记忆 + MCP | 第 1~2 天 |
| 3 | 块 3 | 人事 NL2SQL + 制度 RAG,各 1 分钟 | 第 2~3 天 |
| 4 | 块 4 | 60 题 · 每次练一个分类约 10 题 | 第 3 天起 |
| — | 第二阶段 | 定位题、技术词、其他项目、行为面… 查阅用 | 块 1~4 背熟后 |
心态(块 4 第 60 题):背题是为了 有词可说,真正主场是 国能 6 个 Agent + AI 简历优化 两个项目——答不上概念题时,先分清 国能 ToB 还是 简历 0-1,再拉回「我在那个项目里是这么做的…」
背诵方法 · 口诀 + 3-4-3(不用念给面试官)
这是背稿训练法,面试时不要说出来。
3-4-3 读熟节奏(每块目标约 10 遍)
- 1~3 遍 · 顺句读:只念通顺;卡壳词(RAG、MCP、五层安全…)标出并 单独念 5 遍
- 4~7 遍 · 断句读:按「第一 / 第二 / 收尾」或「层一 / 层二」停在断点处
- 8~10 遍 · 脱稿读:只看 块口诀 + 图像锚点;卡壳 只回看那一句,不从头重读整段
核心数据打包(考前 30 秒默写)
| 数字 | 记法 | 在本稿哪里 |
|---|---|---|
| 95% | 准 | 回答准确率 · 查询成功率 · 隐患分类 |
| 70% | 降 | 制度/人事 人工咨询量下降(两项目都有) |
| 60% | 省 | FAQ 分流后 Token 下降 |
| 100% | 满 | 制度/人事类 自助化率 |
口诀: 95 准 · 70 降 · 60 省 · 100 满
每日 10 分钟巩固
- 早 5 分钟:合上书背完全部 块口诀;默写 95 / 70 / 60
- 晚 5 分钟:随机抽 1 块,用 图像锚点 闭眼回忆;块 4 用闪卡大声答约 10 题
- 考前 30 分钟:只扫 口诀 + 上表 + 附9 清单,不读全文
断点不卡壳(录音法)
- 每块用手机 录一遍脱稿
- 回听标 卡壳断点,为该句编 迷你口诀(例:MCP 产品职责 → 清单·说明书·监控·安全·确认)
- 遮挡练:盖住稿中黄底数字,只看空白说出
块 1 · 120 秒自我介绍(必背 · 可直接念 · 对齐简历)
大家好,我叫马凯强,35 岁,在广州,14 年 ToB 产品经验,Java 开发工程师出身,求职 AI 产品经理,期望在广州发展。
2012 到 2025 年 4 月,我主导 业财一体化 ERP、移动 OA、财税知识付费 等 10 多款 集团级产品从 0 到 1,擅长复杂流程、数据治理和跨系统集成,带过团队;在金不换支撑分公司从 24 家扩张至 35 家,千人组织 系统使用率 100%——这段是 数字化项目,不是 AI 项目。
2025 年 5 月到 2026 年 2 月,我在金安尚科技驻场国能肇庆,基于 Dify 从 0 搭建 6 款集团级 AI Agent:RAG 知识库问答、自然语言 SQL 数据查询(人事、燃料)、培训出题、隐患分类派单、缺陷闭环跟踪。我负责需求拆解、工作流编排、Prompt 工程、Bad Case 复盘和效果评估。上线后制度/人事类咨询 自助化率 100%,人工咨询量 下降约 70%,回答准确率 ≥95%;数据查询从 小时级到秒级,查询成功率 ≥95%;隐患分类 ≥95%,配合 人工确认后再生效。
2026 年 2 月 项目交付离职后,我独立推进 C 端 AI 简历优化助手(0-1):PRD v1.3.2(含 AI 专章)、39 页 C 端小程序高保真原型 + 全模块 B 端运营后台原型(用户服务、套餐 SKU、课程 CMS、提示词/文案/能量点/风控审计等,含接口字段与验收说明),以及研发交接包;用 Cursor 做端到端产品验证,主路径约 15 分钟 从摸底到导出 PDF。
我的优势是 研发背景 + 14 年 ToB 落地 + 近一年 Agent 全链路,能和算法、后端一起把 AI 产品 做准、做稳、可审计。谢谢。
口径口径(心里记住,不必念出来):2025.05 前 只讲 ERP/OA/数字化;2025.05 起 才讲 LLM/Agent。简历里的 RAG 就是「先查制度库再回答」;NL2SQL 就是「说人话查数据库,只读、有权限」。
常见追问:为什么用 Dify,不做一个「AI 对话框」让用户直接问?
问法:「为什么不接个大模型聊天框?」「ChatGPT 套壳不行吗?」
💬 你可以这样答
我们早期也对比过 「一个对话框 + 大模型」,但在国能这种 央企 ToB 场景,单靠聊天框不够,原因很实在:
第一,业务不是一问一答。
制度问答要先 检索知识库,没有命中就不能编;人事查数要 生成 SQL → 校验危险语句 → 只读库 → 按人做行级权限 → 再用人话总结;隐患要 输出固定 JSON → 人工确认 → 才写入工单。这是 一条工作流,不是一轮对话能兜住的。
第二,企业要能管、能查、能回滚。
我们要 Prompt 版本、Bad Case 复盘、FAQ 分流降 Token、异常转人工、操作审计。Dify 这类编排平台,让产品和研发能 可视化拆节点、快速改流程;纯对话框要把这些全塞进前后端自研,周期和运维成本都更高。
第三,成本和准确率。
比如人事 Agent,高频问题走 FAQ 本地匹配,复杂问题才调大模型,Token 降 60% 以上。单纯对话框往往 每问都调大模型,贵,还不一定准。
收尾:
所以我的选型逻辑是:场景简单 → 对话或 FAQ 够用;场景复杂 → 工作流 + 检索 + 工具。Dify 是当时的 落地载体,不是唯一答案;若贵司有自研 Agent 平台,我照样按 流程、权限、评估 这套产品方法设计。C 端简历也不是聊天框,而是 分步骤的主路径 + 后台可配,道理一样。
常见追问:年龄偏大 / 1990 年 / 35 岁还做 AI 产品吗?
问法:「你年龄不小了」「1990 年的,跟得上 AI 吗?」「我们更想要年轻人」
💬 你可以这样答
我理解您关心的是 能不能把 AI 产品落地、能不能长期稳定交付,我正面回答。
第一,岗位要的是「做准、做稳、可审计」,不只是追热点。
我 Java 出身 + 14 年 ToB,在国能把 6 款 Agent 从需求做到上线指标;C 端简历也是 PRD → 原型 → 后台配置 → 研发发包 全链路。AI PM 很多难点在 权限、合规、Bad Case、跨部门对齐——这些靠 项目经验,不靠年龄小。
第二,我在 AI 上不是「旁观者」。
2025 年 5 月起 全职做 LLM Agent(RAG、NL2SQL、工作流、Prompt 迭代);离职后 独立推进 C 端 0-1,工具用 Cursor,方法和国能同一套:指标、评测、成本、Human-in-the-loop。
第三,年龄对应的是企业落地必需、但很难短期练出来的能力。
年轻同事往往 工具学得快、想法新;我这边补的是 14 年 ToB 沉淀:
- 业务落地:复杂流程、数据治理、跨系统对接,知道什么该先做 MVP、什么不能省;
- 管理与交付:带过团队、扛过 24→35 家 扩张和金不换 100% 使用率,国能 6 款 Agent 按期上线;
- 沟通与推动:国能做过 6 部门访谈、12 场培训,能把业务、研发、合规 拉到同一张验收表上。
大模型可以换、平台可以换,但 AI 进企业 最后卡在 对齐指标、过合规、推上线、守运营——这些正是我的强项。
收尾(不卑不亢):
我不是和年轻人比「谁更会用新工具」,而是 AI 能力 + 企业落地能力 一起带进来。若贵司偏 B 端 Agent / 合规 ToB,这套组合是匹配的;您也可以直接考我 某个场景怎么拆工作流、怎么定指标——用专业说话。
口径口径(心里记住):不道歉、不贬低年轻人(可说「年轻同事工具学得快」);强调 互补 而非 替代;1990 年 ≈ 35 岁,与自我介绍一致即可。
常见追问:项目链接里怎么只有小程序,后台呢?
问法:「你这项目是不是只做了前端?」「运营后台在哪?」
💬 你可以这样答
不是只做 C 端。我交付的是 C 端 39 页 + 全模块 B 端运营后台原型,后台覆盖 留言/退款、用户 360°、订单与 SKU、课程 CMS、提示词与系统文案、邀请增长、数据大屏、审计与风控 等;每页有 dev-spec、接口 METHOD/path、字段映射和验收路径,研发可以 仅凭文档联调。
公开链接因项目保密,目前只放了 C 端演示;后台和完整接口包 面试时可以现场打开(本地 HTML 原型 + 交接文档),或按模块给您 口述清单。我角色是 产品经理,原型是 Vibe Coding 验证;正式上线仍要研发工程化,但 后台怎么配、接口怎么定 是我输出的。
块 2-1 · Agent 长期记忆 / Agent Memory(必背)
问法:「你们 Agent 有记忆吗?」「如果要跨会话记住用户,你怎么做?」
【先背 · 30 秒 · 框架】
Agent 记忆我一般分 四层 来讲:
① 工作记忆:当前这轮对话 + 刚调工具返回的结果,都在 上下文窗口 里,满了就要摘要或丢弃。
② 短期/会话记忆:本会话里用户说过什么、槽位填到哪(工号、部门、时间范围),保留最近 N 轮。
③ 中期记忆(可选):一个 长任务跨多轮 但还没结束,比如缺陷跟踪「上次催办到哪了」——用 任务 ID + 状态表 存,不必塞进模型脑子。
④ 长期记忆(跨会话):再拆两种——情景记忆(某次具体事件,带时间);语义记忆(稳定偏好和事实,比如「默认查近 30 天」「喜欢表格展示」)。长期记忆要 写入时抽取摘要、向量或结构化入库;读取时检索相关片段注入 Prompt,还要有 过期/删除/用户可导出。
【再背 · 2 分钟 · 面试主力答法(ToB + 国能实线)】
💬 你可以这样答
我会把记忆分成 三层,不会一上来就让大模型「记住用户一切」。
第一层:短期记忆(会话内)
就是这一轮对话里,用户说了什么、Agent 查到了什么、执行到哪一步。做法通常是 保留最近 N 轮对话 + 关键槽位,比如工号、部门、时间范围、当前工单号。我在 人事 NL2SQL、缺陷跟踪 里主要用这套,够应对连续追问。
第二层:业务记忆(推荐 ToB 默认用这个)
我不建议让模型「脑记」业务数据,而是 系统查业务库:上次工单状态、考勤结果,用 用户 ID / 工号 关联查询。这样 更准、可审计、也好做权限。国能央企场景,我们 跨会话长期记忆没上线,很大原因是 隐私、等保、审计;用业务库替代,效果上用户该查到的还是能查到。
第三层:产品长期记忆(用户偏好)
比如用户喜欢表格展示、常问的三类问题、默认时间范围——这才需要 单独存 User Profile。产品设计时我会先定四件事:
- 记什么:只记和产品相关的偏好,不记敏感原文
- 不记什么:薪资、处分、未授权字段一律不进入记忆
- 记多久:过期自动删;用户可 查看、导出、删除(对齐个保法)
- 怎么用:每次对话 检索相关记忆片段注入 Prompt,而不是把全部历史聊天记录塞进去
和研发的分工:Profile 表结构、加密、检索策略研发实现;我出 PRD:字段、授权流程、兜底话术、评估指标。
怎么评估:看 用户是否少重复说一遍、任务成功率是否提升;还要看 误记率、隐私投诉——长期记忆记错了比没有记忆更伤。
收尾(诚实 + 自信):
国能项目因合规 没上第三层;若贵司要做,我可以按上面框架从 小范围试点 开始,比如只记「默认查询时间范围」,验证后再扩。
块 2-2 · MCP(必背)
问法:「了解 MCP 吗?」「我们工具很多,怎么接 Agent?」
💬 你可以这样答
MCP(Model Context Protocol)可以理解成 大模型连接外部工具的「统一插座」。以前接日历、数据库、企业微信,每家一套接口;MCP 让工具以 标准 Server 形式暴露,模型通过协议调用, 便于扩展和治理。
国能现场:我主要用 Dify 的工具节点、HTTP 插件、代码节点,没有以 MCP 名义上线,但 产品职责是一样的——定义 Agent 能调哪些工具、输入输出 Schema、超时重试、权限和审计。
如果贵司要上 MCP,我作为 AI PM 会做这些事:
- 工具清单:哪些给 Agent 用,哪些不给(最小权限)
- 每个工具的「产品说明书」:干什么、失败提示、是否需用户确认
- 和现有编排的关系:Dify/自研 Agent 框架里 MCP Server 怎么注册
- Bad Case 与监控:哪个工具调用失败最多、Latency 如何
- 安全:敏感工具必须 Human-in-the-loop 或二次鉴权
诚实边界:我 还没在生产环境主导 MCP 选型,但 6 个 Agent 的工具编排、降级、复盘我都做过, 迁到 MCP 主要是工程协议层变化,产品方法论是通的。入职后我会优先熟悉贵司现有 MCP 规范和一条业务线试点。
面试说「介绍一个项目」→ 优先讲这两个。背熟下面两段 1 分钟稿,追问扫一眼即可。
块 3-1 · 企业人事智能查询 · NL2SQL(2025.11—2026.02)⭐ 建议主力
1 分钟:
员工以前查人事数据要找 HR,口头描述需求,HR 再查系统,慢而且占人力。我用 Dify 搭了 NL2SQL Agent,员工用自然语言提问,系统生成 只读 SQL 查人事库,再用白话总结。安全上做了 五层:参数校验、FAQ 分流、SQL 拦截、只读库、行级权限。高频问题走 FAQ 本地匹配,Token 成本降了 60% 以上。上线后 HR 咨询量降约 70%,查询 成功率 ≥95%,基本 秒级 返回。
追问 · 口语答:
- SQL 注入和数据安全?
只用 只读账号;执行前拦截 delete、update、drop 等;SQL 在代码节点里校验;敏感字段按 员工/部门负责人/管理员 三级权限;操作有审计日志。
- 业务人员说的黑话、口语部门名怎么懂?
维护 业务别名表和口径字典,Bad Case 里口语化问题会反哺这张表;口径变更时 改字典、灰度验证,尽量不动代码。
- 和 ChatBI 有什么区别?
我们 限定人事域,强合规、强权限,不是开放分析平台;目标是 HR 咨询降负,不是随便拖表。
- 举一个不满意的 Bad Case?
比如用户说「综合部人数」,系统映射错部门 → 我们补别名、加确认话术「您指的是 XX 部门吗?」→ 回归测试同类问法。
块 3-2 · RAG 制度智能问答(2025.08—2026.02)⭐ 建议主力
1 分钟:
央企制度多、更新快,员工常问 HR。用 RAG 做制度问答,准确率 ≥95%,制度相关咨询 降约 70%,目标是 零编造——没有检索就不答。制度更新走 增量入库;长文档 分段检索 + 多轮。
追问:注入攻击 → 输入过滤 + 审计;怎么证明没瞎编 → 引用制度片段 + 抽检 + 幻觉率指标。
格式见文首「本稿格式」:粗体=题号 · 正文=要背的口语 · 斜体=不用背
建议练习顺序(和块 2、3 最贴): ① 二、NL2SQL(13~20) → 接块 3-1 人事 ② 一、RAG(1~12) → 接块 3-2 制度 ③ 三、Agent(21~35) → 接块 2 Agent 记忆/MCP ④ 再练 四、Prompt(36~45) · 五、通用(46~55) · 六、工具简历(56~60) 不必 60 题全文背诵,每次大声答 10 题即可。
一、RAG 与知识库(1~12)
二、NL2SQL 与数据 Agent(13~20)
三、Agent 与工具(21~35)
四、Prompt · 模型 · 成本(36~45)
两个 AI 项目别混:国能是 6 款 ToB Agent;AI 简历优化是离职后独立 0-1。
Bad Case 是什么?怎么用?
常夹在幻觉、迭代、和算法协作里问。
就是答错了、用户不满意、业务不认账的真实例子,要记下来当错题本,不能只说「感觉不准再优化」。
怎么用:收集(日志、工单、业务反馈)→ 分类(检索、Prompt、权限、别名、模型)→ 找根因 → 改 → 同一批错题再测,看同类错误有没有降下来。
举例:国能人事口语部门名查不对,就补业务别名表;制度跨章节漏召回,就调 chunk 和混合检索;简历项目夸大经历,就 Prompt 禁止编造并单列一类每周抽检。详表见附3 §6、附10。
制度问答:没检索到就不答,还要带引用。分类和 SQL:低温度、固定 JSON 格式。NL2SQL:拦截危险语句、结果对账。隐患:人工确认后再入库。简历:提交前校验禁止编造。所有场景:错题本改完要回归测。
国能人事高频问走 FAQ 本地匹配,不调大模型,Token 能降六成以上。长对话做缓存或摘要,别重复喂全文。简历项目复杂步骤用标准版、简单步骤用基础版,预算触顶自动降级。还要限流防刷,RAG 只喂相关段,别整库塞进 Prompt。
用 RAG 只检索相关段;多轮对话保留最近几轮加摘要;NL2SQL 只给相关表结构和口径;简历 OCR 合并太长就截断并提示;缺陷跟踪只加载当前工单时间窗,不拉全厂历史。
五、AI 产品经理通用(46~55)
六、Vibe Coding · 工具 · 简历(56~60)
以下 不用按顺序全文背。面试前 30 分钟可扫 附9 考前清单;被问到再翻 附2 定位题、附3 技术词。
附1 · 面试地图(一场面试四段话用哪一块)
| 面试官在问什么 | 用哪一块 |
|---|---|
| 自我介绍 / 为什么转 AI PM | 块 1 + 附2 |
| Agent 记忆、MCP、ReAct、怎么设计 | 块 2 + 附4 |
| 介绍项目、RAG、NL2SQL、Bad Case | 块 3 + 附5 |
| 概念题、RAG 流程、Prompt、成本 | 块 4 + 附3 |
| 行为面、离职原因、挑战 | 附7 |
| 反问 | 附8 |
附2 · 定位类 6 题
1. 为什么转 AI 产品经理?
问法:你为什么做 AI PM?是不是跟风?
💬 你可以这样答
我不是去年才开始接触 AI。之前十几年一直在做 ToB,ERP、OA、人事系统、数据治理都做过,擅长把业务流程和产品落地。2025 年 5 月起在国能肇庆,我从 0 参与设计了 6 款 Agent 上线,制度 RAG、人事和燃料 NL2SQL、培训出题、隐患派单、缺陷跟踪都有,从需求、工作流、Prompt、评估到 Bad Case 复盘我都负责。2026 年又独立做了 C 端 AI 简历产品,PRD、原型、运营后台、研发交接都走完了。所以转 AI PM 是有项目支撑的,不是只看热闹。
2. 你和算法 / 后端怎么分工?
问法:AI 产品和技术怎么配合?你会不会只是写 PRD?
💬 你可以这样答
我定场景、用户路径、成功指标,还有 Prompt 和工作流怎么编排、什么必须人工审核、Bad Case 怎么闭环。算法和后端负责模型选型、向量库、SQL 引擎、权限和性能。我开发出身,能看懂接口和日志,联调时不会对扯皮。举个例子:人事 NL2SQL 里「部门口语化查不对」,我会和研发一起看是别名表问题还是 Prompt 问题,改完用同一批测试题验证,而不是只说「效果不好再优化」。
3. 你学的是不是皮毛?抖音那些 Agent 记忆、MCP 你懂吗?
问法:感觉 AI 变化很快,你跟得上吗?
💬 你可以这样答
我不靠背论文,我靠落地。每个 Agent 都有准确率、自助化率、Token、幻觉这些指标,还有每周抽检和 Bad Case 表。抖音上的 Agent 记忆、MCP,我理解概念,也清楚产品该怎么设计——国能因为央企合规,跨会话长期记忆我们没上,用的是业务库加会话上下文;MCP 我现场用 Dify 工具节点,原理一样。如果贵司要用 MCP 或长期记忆,我可以按 块 2 那套思路讲怎么设计,和我现有经验是接得上的。
4. 2018 年以前的 ERP 还要讲吗?
问法:你简历很长, oldest 的项目和 AI 有什么关系?
💬 你可以这样答
老项目证明我有 ToB 基本功:复杂流程、多组织、数据口径、跨系统集成、带团队。AI 能力从 2025 年 5 月 国能 Agent 才开始写。面试时老项目我讲数字化成果;AI 细节只绑 Agent 和 C 端简历,不会把 ERP 说成 AI 项目。
5. 期望薪资 30~35K 的依据?
问法:你的期望为什么是这个区间?
💬 你可以这样答
结合广州市场和岗位:14 年 ToB 产品经验、带团队、研发背景,加上近一年 6 款 Agent 从 0 到上线,以及 C 端 0-1 的 PRD 和原型交付。我更看 能力匹配 和 能独立负责 AI 场景,具体可以聊。
6. 你日常用哪些 AI 工具?(抖音常问)
问法:你平时用什么 AI 工具?
💬 你可以这样答
工作流编排用 Dify 做 Agent;产品验证用 Cursor 做 Vibe Coding,C 端 39 页原型很多是这样快速搭出来再交给研发的;文档和 PRD 用大模型辅助写结构和润色,但业务规则、指标、合规我自己定稿;协作用常规办公和项目管理工具。工具会变,关键是 场景、指标、Bad Case 这套方法不变。
附3 · 技术词查阅(15 个)
用法:面试官 点名某个词 时用本章;若他说「讲讲你做的制度问答」,直接去 第五章 G,别整章背。 结构:什么时候答(不用背)→ 正文(要背的口语)→ 结合项目(有则背)→ 常见追问(被追问再看)。 面试官不懂英文时:先说「就是……」人话,再讲项目里哪一步,别只堆 RAG、HITL 等缩写。 项目别混:国能 = 6 款 ToB Agent(文本);AI 简历优化 = 独立 0-1(含 OCR/多模态)。
1. RAG(检索增强生成)
不用背什么时候答:简历写了制度问答 / 培训出题;或问「怎么防幻觉」「知识库怎么建」。
RAG 就是先查资料再回答。大模型自己编容易瞎说,我们先从制度库、题库里检索相关段落,再让模型只根据检索到的内容组织答案,这样私有知识能更新,幻觉也会少很多。
结合项目:
在国能我做了两个 RAG:制度问答 和 培训出题。制度是按章节切分,有重叠,再向量检索,Prompt 里写死「没有检索结果不许编,要引导找人工」。培训出题是在五大题库里按类别检索,再出题,避免跨类、避免编造。
常见追问 · 口语答:
- Chunk 怎么切?
按制度章节或条款切,一段大概 200~500 字,相邻段 重叠 10%~20%,避免一句话被切两半导致搜不到。
- 召回率低怎么办?
先看是切分问题还是检索问题:可以 混合检索(向量 + 关键词),加 Rerank 精排,调 Top-K;Bad Case 里把「搜不到的问法」收集起来专门测。
- 没搜到还回答怎么办?
产品规则就是 不许编。返回「未找到相关制度,建议联系 XX 部门」,并留人工入口;这在我们央企场景是硬要求。
- 怎么评估效果?
看 回答准确率、幻觉率、引用是否命中;每周抽一批问题盲测,业务方也会参与抽检。
2. NL2SQL(自然语言查数)
不用背什么时候答:人事 Agent、燃料 Agent;或问「ChatBI」「Text2SQL」「数据安全」。
NL2SQL 就是员工说人话,系统生成只读 SQL 去查业务库,再用自然语言总结结果。适合考勤、编制、燃料消耗这类结构化数据。
结合项目:
人事和燃料两个 Agent 都是 Dify 工作流。前面有意图识别和业务别名(比如口语「综合部」映射到标准部门名),中间生成 SQL,后面 五层安全:参数校验、FAQ 分流、SQL 危险语句拦截、只读库、行级权限。人事高频问题走 FAQ,Token 能降 60% 以上。
常见追问 · 口语答:
- 表太多怎么办?
先 限定主题域(人事一套、燃料一套),给模型 Schema 摘要和别名表,不要一次扔几百张表。表特别多时,可以加一步「先推荐 Top 相关表」再生成 SQL——产品上要定义推荐错了怎么兜底。
- SQL 错了怎么办?
执行前 语法校验、拦截 delete/update 等;执行后 结果抽样、空结果/异常量告警;错例进 Bad Case,改 Prompt 或补别名,不是只改模型。
- 和 RAG 有什么区别?
RAG 查文档(制度 PDF、Word);NL2SQL 查数据库表。我们制度用 RAG,人事编制用 NL2SQL,选型看数据在哪。
3. Function Calling / 工具节点
不用背什么时候答:问 Agent 怎么执行动作、怎么调 API、Dify 里工具节点是什么。
Function Calling 就是模型不只会说话,还能决定调用哪个工具,比如查库、算数、调 HTTP 接口,拿到真实结果再继续推理。在 Dify 里我主要用工具节点和代码节点实现,和 Function Calling 是一类能力。
结合项目:
人事 Agent 里:FAQ 匹配、权限校验、SQL 执行、结果格式化都是节点;隐患 Agent 里输出固定 JSON 给工单系统。产品上要定义 每个工具输入输出、失败怎么办、谁有权限调。
常见追问:
- 工具调用失败?
重试 1~2 次 → 换降级话术 → 转人工;日志里要能看到 哪一步失败,方便 Bad Case。
- 和 MCP 什么关系?
MCP 是 接工具的统一协议标准;我在国能用 Dify 插件/HTTP 工具, 产品思路一样。MCP 怎么选型见 块 2-2。
4. Human-in-the-loop(人在回路)
不用背什么时候答:隐患派单、缺陷跟踪;或问「AI 错了谁负责」「央企能不能全自动」。
就是 AI 出建议,人点确认后才生效。安全、派单、涉责场景必须这样,不能 AI 直接改生产数据。
结合项目:
隐患分类 Agent 输出类别、责任部门、紧急程度,审核员确认后才写入 IMS 工单。一开始人工多,准确率高了之后,可以只对 低置信或高风险 强制人工,用 人工介入率 看效率。
追问:会不会很慢?
首月会慢,但相比以前 30 分钟一单,AI 1 分钟出建议、人 2 分钟确认,整体还是快很多;指标上 分类准确率 ≥95% 才逐步放权。
5. 幻觉防控
不用背什么时候答:任何 AI 项目都会问;C 端简历尤其会问「会不会编造经历」。
幻觉就是模型一本正经胡说。产品不能单靠 Prompt 里写请勿编造,要检索约束、格式约束、校验、评估一起上。
结合项目:
制度 RAG:无检索不回答 + 引用来源;NL2SQL:只读库 + 结果对账;分类 Agent:低温度 + JSON Schema;C 端简历:禁止编造经历 + 提交前校验 + Bad Case。目标上关键场景 宁可说不知道,也不编。
6. Bad Case 复盘
不用背什么时候答:问你怎么迭代、怎么和算法协作、效果怎么持续提升;或面试官问「Bad Case 是什么?」(很多人没听过这个词)。
Bad Case,中文你就理解成错题本:答错的、用户不满意的、业务不认账的真实例子。不是骂用户,而是把这些例子当资产,用来改产品。
怎么用(五步,面试可直接说):
收集(日志、工单、HR/业务反馈)→ 分类(检索 / Prompt / 权限 / 别名口径 / 模型)→ 找根因 → 改(补别名表、调 chunk、改 Prompt、加校验)→ 同一批错题再测一遍,看同类错误率有没有下来。
结合项目(先说归属):
- 国能·人事:「口语部门名查不对」→ 补 业务别名表
- 国能·制度:「跨章节漏召回」→ 调 chunk + 混合检索
- AI 简历优化:「夸大/虚构经历」→ Prompt 禁止编造 + Bad Case 单列一类 每周抽检
和算法怎么协作:你带 错题列表 + 指标 开会,不用「感觉不准」;改完必须 回归同一批题。详表见 附10 各项目 Bad Case 分类。
7. 效果评估
不用背什么时候答:问 KPI、上线后怎么盯、和老板怎么汇报。
我分三层:技术层(准确率、幻觉率、延迟、SQL/JSON 合规率)、产品层(自助化率、查询成功率、人工介入率)、业务层(咨询量降多少、审核量降多少、决策快多少、Token 花多少)。
结合项目:
制度/人事 咨询量降约 70%,NL2SQL 成功率 ≥95%,隐患分类 ≥95%。上线后有 日报 + 每周抽检 + 月度业务复盘,指标掉下去当天就要查。
8. Prompt 工程 + 版本回退
不用背什么时候答:问和微调怎么选、Prompt 怎么写、线上出问题怎么回滚。
Prompt 就是给模型的岗位说明书:你是谁、干什么、不能干什么、输出什么格式。企业里还要能版本管理、能 5 分钟生效、出问题能一键回退——我在 C 端 PRD 和 B 端原型里都设计了提示词配置和回退。
和微调怎么选(口语):
知识常变、要快迭代 → Prompt + RAG 优先;格式极其固定、数据量很大、Prompt 顶不住 → 再考虑微调。国能 6 个 Agent 和 C 端简历,都以 Prompt + 工作流为主。
9. Token / 成本治理
不用背什么时候答:问商业化、C 端怎么控本、企业怎么降 API 费用。
大模型按 Token 计费,产品要想少调用、用小模型、缓存、分流。
结合项目:
人事 Agent:FAQ 本地匹配,高频问题不调大模型,Token 降 60%+。C 端简历:模型分档,复杂用标准版、简单用基础版,预算触顶 自动降级,界面上 不暴露模型名,只显示「标准版/基础版」。
10. Vibe Coding(Cursor)
不用背什么时候答:问你会不会用 AI 写代码、原型谁做的、和研发边界。
Vibe Coding 是产品经理用 AI 编程助手快速搭原型、验证交互和规则,不是替代正式研发。我用 Cursor 做 C 端 39 页 + B 端运营后台可点原型,对齐 PRD 和 dev-spec,研发接手时有接口和验收标准;公开链接因保密只放 C 端,后台面试可展示。
抖音说的「五层能力」(口语):
① 需求边界(PRD 里 AI 能做什么不能做什么)② Prompt 和规则 ③ 工作流和页面 ④ 异常兜底(超时、失败不扣点)⑤ 评估和 Bad Case。我 ①②④⑤ 都做过;正式上线 安全、性能、合规 仍要研发工程化。
11. Context Window(上下文窗口)
不用背什么时候答:问对话太长怎么办、制度很长怎么塞进去。
就是模型一次能读多长的内容,有上限。所以长制度不能整本塞进 Prompt,要用 RAG 只喂相关段;多轮对话用最近几轮加摘要;缺陷 Agent 只加载当前工单时间窗的信息。
12. Dify 工作流
不用背什么时候答:问你们技术栈、Agent 怎么编排。
Dify 是可视化把意图识别、检索、SQL、校验、生成串成一条链。6 个 Agent 各有一条主流程,共性节点包括:FAQ 分流、权限、异常分支、转人工。
13. AI 治理(安全 / 合规 / 成本)
不用背什么时候答:ToB、央企、C 端小程序合规。
AI 上线不只看准不准,还要看权限、审计、内容安全、成本上限。国能:只读库、SQL 注入防护、三级人事权限、操作留痕;C 端:深度合成相关合规、失败不扣能量点、分享打码等。
14. 多模态 / OCR(图片·文档·摄像头)
不用背什么时候答:问「多模态了解吗」「简历能不能传图」「OCR 谁做」。
查阅口语 30 秒:见块 4 第 43 题(背那一段即可)。查阅提示:OCR/多模态在 AI 简历优化;国能 6 个 Agent 是纯文本,口头不必对比。
附4 · 设计题 10 问(块2已背 1~2,其余查阅)
这类题 HR 和业务都会问:「我们将来要做 XXX,你会怎么设计?」 答法结构:① 先说概念(30 秒)② 说你会怎么设计(1~2 分钟)③ 诚实说国能为什么没做/你用什么替代 ④ 接一句「和我现有 Agent 经验相通」。
必背1. Agent 长期记忆怎么设计?(抖音超高频 · 必背)
🧠 Agent 记忆 · 四层框架(先背 30 秒版)
ToB 面试答法 → 收敛为三层:会话内 · 业务库 · 用户偏好
问法:「你们 Agent 有记忆吗?」「如果要跨会话记住用户,你怎么做?」
💬 你可以这样答
我会把记忆分成 三层,不会一上来就让大模型「记住用户一切」。
第一层:短期记忆(会话内)
就是这一轮对话里,用户说了什么、Agent 查到了什么、执行到哪一步。做法通常是 保留最近 N 轮对话 + 关键槽位,比如工号、部门、时间范围、当前工单号。我在 人事 NL2SQL、缺陷跟踪 里主要用这套,够应对连续追问。
第二层:业务记忆(推荐 ToB 默认用这个)
我不建议让模型「脑记」业务数据,而是 系统查业务库:上次工单状态、考勤结果,用 用户 ID / 工号 关联查询。这样 更准、可审计、也好做权限。国能央企场景,我们 跨会话长期记忆没上线,很大原因是 隐私、等保、审计;用业务库替代,效果上用户该查到的还是能查到。
第三层:产品长期记忆(用户偏好)
比如用户喜欢表格展示、常问的三类问题、默认时间范围——这才需要 单独存 User Profile。产品设计时我会先定四件事:
- 记什么:只记和产品相关的偏好,不记敏感原文
- 不记什么:薪资、处分、未授权字段一律不进入记忆
- 记多久:过期自动删;用户可 查看、导出、删除(对齐个保法)
- 怎么用:每次对话 检索相关记忆片段注入 Prompt,而不是把全部历史聊天记录塞进去
和研发的分工:Profile 表结构、加密、检索策略研发实现;我出 PRD:字段、授权流程、兜底话术、评估指标。
怎么评估:看 用户是否少重复说一遍、任务成功率是否提升;还要看 误记率、隐私投诉——长期记忆记错了比没有记忆更伤。
收尾(诚实 + 自信):
国能项目因合规 没上第三层;若贵司要做,我可以按上面框架从 小范围试点 开始,比如只记「默认查询时间范围」,验证后再扩。
2. MCP 是什么?你们用过吗?如果要用你怎么做?
问法:「了解 MCP 吗?」「我们工具很多,怎么接 Agent?」
💬 你可以这样答
MCP(Model Context Protocol)可以理解成 大模型连接外部工具的「统一插座」。以前接日历、数据库、企业微信,每家一套接口;MCP 让工具以 标准 Server 形式暴露,模型通过协议调用, 便于扩展和治理。
国能现场:我主要用 Dify 的工具节点、HTTP 插件、代码节点,没有以 MCP 名义上线,但 产品职责是一样的——定义 Agent 能调哪些工具、输入输出 Schema、超时重试、权限和审计。
如果贵司要上 MCP,我作为 AI PM 会做这些事:
- 工具清单:哪些给 Agent 用,哪些不给(最小权限)
- 每个工具的「产品说明书」:干什么、失败提示、是否需用户确认
- 和现有编排的关系:Dify/自研 Agent 框架里 MCP Server 怎么注册
- Bad Case 与监控:哪个工具调用失败最多、Latency 如何
- 安全:敏感工具必须 Human-in-the-loop 或二次鉴权
诚实边界:我 还没在生产环境主导 MCP 选型,但 6 个 Agent 的工具编排、降级、复盘我都做过, 迁到 MCP 主要是工程协议层变化,产品方法论是通的。入职后我会优先熟悉贵司现有 MCP 规范和一条业务线试点。
3. ReAct 是什么?和你们 Dify 工作流一样吗?
💬 你可以这样答
ReAct 是 Reason(推理)→ Act(行动)→ Observe(观察结果) 再循环,直到任务完成。比如:先想「要查人事库」→ 调 SQL 工具 → 看结果不对 → 改条件再查。
Dify 工作流可以是 固定流程,也可以是 带分支的多步,和 ReAct 思想接近。我的 隐患、缺陷 Agent 更接近「多步 + 工具」; 制度 RAG 更像固定链:检索 → 生成。面试里我会说:不是所有场景都要强 Agent,问答类 RAG 够用就行, 派单、跟踪类才上 ReAct 式编排。
4. RAG 和 Agent 有什么区别?你们为什么两个都做?
💬 你可以这样答
RAG 解决 「知识从哪来、怎么别瞎编」,典型是制度问答、培训出题。
Agent 解决 「多步完成任务、调工具、有状态」,典型是隐患派单、缺陷催办。
可以这么记:RAG + 对话是弱 Agent;我们 隐患、缺陷是强 Agent。选型看用户要完成 一步问答 还是 一条业务链路。
5. 混合检索、Rerank 是什么?产品上要关心吗?
💬 你可以这样答
向量检索 懂语义,但有时漏关键词;关键词/BM25 对制度编号、专有名词更准。混合检索 就是两个一起用再合并结果。Rerank 是用一个小模型对 Top 结果 再排一次序,提高「喂给大模型的段落」质量。
产品上要定:召回不够时先调检索还是调 Prompt;Bad Case 里要标 是检索错还是生成错——这决定改知识库还是改模型参数。
6. Agent 怎么评估?除了准确率还看什么?
💬 你可以这样答
除了 任务成功率、回答准确率,我还看:
- 步数/耗时:Agent 是否绕圈
- 人工介入率:多少单必须人点确认
- 工具调用成功率
- Grounding:回答是否真有检索/SQL 依据
- 业务结果:派单是否更快、咨询是否减少
C 端还会看 完成率、留存、单次 Token 成本。
7. Agent 死循环 / 越跑越偏怎么办?
💬 你可以这样答
产品规则上设 最大步数、总超时、重复检测(同一步骤重复 3 次就停);给用户 明确失败提示和转人工;日志里记录 每一步决策,方便 Bad Case。不会让用户对着屏幕干等。
8. 多 Agent 协作 / 主 Agent 拆子 Agent 你怎么想?
💬 你可以这样答
按 业务域拆,比如「人事 Agent」「燃料 Agent」分开,不要一个 Agent 包打天下——我们国能就是这么做的。若要做「总前台」,可以是 路由 Agent 先识别意图再 分发给子 Agent,产品上要定义 交接上下文带哪些字段、失败谁兜底。
9. RAG 知识库怎么构建?(抖音:骆齐那类题)
💬 你可以这样答
① 收资料:制度、题库、FAQ,定 owner 和更新频率
② 清洗:去重、去密、版本号
③ 切分:按章节/条款,控制长度和 overlap
④ 向量化入库
⑤ 试检索 + 试回答,用 Bad Case 调 chunk 和检索策略
⑥ 上线后增量更新,不是一次完事
制度更新时我们走 增量入库,不是整库推翻重来。
必背10. AI 问答不准,你怎么排查?(通用排查五步法 · 必背)
💬 你可以这样答
我固定五步,不和研发瞎猜:
- 检索有没有——该搜到的搜到了吗?
- Prompt 有没有用检索——是不是模型没用上片段?
- 模型参数——温度是不是太高?
- 权限和数据——是不是用户根本没权限看这条数据?
- Bad Case 是否重复——同类错误进表,改完回归
这五步在国能 每周复盘 都会用。
附5 · 全部项目(块3已背 B+G,其余查阅)
用法:面试官说「介绍一个项目」→ 选 2 个主力(建议 人事 NL2SQL + 制度 RAG,或 隐患 HITL + C 端简历)背熟 1 分钟稿;其余项目 知道 30 秒版 即可。
A. C 端 · AI 简历优化助手(2026.02—至今)
1 分钟(可直接念):
这个项目是给求职者用的 AI 简历助手,目标是用大约 15 分钟 走完摸底、初稿、JD 对齐、HR 预览到导出 PDF。我独立完成了 PRD v1.3.2,里面单独写了 AI 能力专章,包括能力边界、输入输出、质量指标、评测方法和成本安全;还做了 39 页 C 端可交互原型 + 全模块 B 端运营后台原型(用户/交易/内容/增长/数据与风控等),以及含 接口、字段、JSON 示例、验收路径 的研发交接文档。原型阶段用 Cursor 做 Vibe Coding,C 端和后台规则都是先验证再交给研发。公开演示链接因保密只展示 C 端;后台面试可现场展示。合规上按微信小程序 深度合成 相关要求做了评估,设计了失败不扣点、分享打码等规则。
追问 · 口语答:
- PRD 里 AI 专章写什么?
写清楚 能做什么、不能做什么;每个 AI 能力的输入输出;准确率/完成率等指标;怎么评测;Token 和模型分档;失败和超时怎么处理。研发不能猜。
- 怎么防编造简历经历?
Prompt 禁止编造 + 提交前校验 + 用户确认;Bad Case 里专门有一类「夸大/虚构」;宁可提示用户补充,也不自动编一段假经历。
- 成本怎么控?
模型分档,复杂步骤用标准版,简单用基础版;预算触顶自动降级;后台可看单次和日均 Token;用户界面 不暴露模型名。
- Vibe Coding 和研发边界?
我用 Cursor 做 原型和规则验证;上线版本的 安全、性能、支付、合规 必须研发工程化,我交付 PRD、原型、接口和 Done 定义。
- 为什么链接里只有小程序?后台做了吗?
做了 全模块 B 端运营后台(留言退款、用户 360°、SKU/订单、课程 CMS、提示词/文案、增长、审计风控等),每页带 接口与验收说明。公开链接受保密只展示 C 端;面试可 现场打开后台原型 或按模块口述。
- 多模态 / 上传简历图 / OCR 做了吗?
做了,在 AI 简历优化里:摸底和 JD 可传图 OCR,图会压缩,失败不扣点;还有留言附图和表情摄像头。口语直接背块 4 第 43 题。
必背B. 企业人事智能查询 · NL2SQL(2025.11—2026.02)⭐ 建议主力
🛡️ 人事 NL2SQL · 五层安全(必记)
- 参数校验
- FAQ 分流
- SQL 拦截
- 只读库
- 行级权限
高频走 FAQ → Token 降 60%+ · 成功率 ≥95%
1 分钟:
员工以前查人事数据要找 HR,口头描述需求,HR 再查系统,慢而且占人力。我用 Dify 搭了 NL2SQL Agent,员工用自然语言提问,系统生成 只读 SQL 查人事库,再用白话总结。安全上做了 五层:参数校验、FAQ 分流、SQL 拦截、只读库、行级权限。高频问题走 FAQ 本地匹配,Token 成本降了 60% 以上。上线后 HR 咨询量降约 70%,查询 成功率 ≥95%,基本 秒级 返回。
追问 · 口语答:
- SQL 注入和数据安全?
只用 只读账号;执行前拦截 delete、update、drop 等;SQL 在代码节点里校验;敏感字段按 员工/部门负责人/管理员 三级权限;操作有审计日志。
- 业务人员说的黑话、口语部门名怎么懂?
维护 业务别名表和口径字典,Bad Case 里口语化问题会反哺这张表;口径变更时 改字典、灰度验证,尽量不动代码。
- 和 ChatBI 有什么区别?
我们 限定人事域,强合规、强权限,不是开放分析平台;目标是 HR 咨询降负,不是随便拖表。
- 举一个不满意的 Bad Case?
比如用户说「综合部人数」,系统映射错部门 → 我们补别名、加确认话术「您指的是 XX 部门吗?」→ 回归测试同类问法。
C. 燃料数据分析 · NL2SQL(2025.11—2026.02)
🛡️ 人事 NL2SQL · 五层安全(必记)
- 参数校验
- FAQ 分流
- SQL 拦截
- 只读库
- 行级权限
高频走 FAQ → Token 降 60%+ · 成功率 ≥95%
1 分钟:
燃料成本分析以前靠人工导数、做表,动辄 小时级。这个 Agent 用 NL2SQL 查燃料数据,并给 分析建议,响应 秒级,帮助成本优化大约 2%~5%。架构和人事类似,但 成本数据更敏感,行级权限和脱敏更严。
追问:敏感数据 权限 + 脱敏 + 审计;口语指标名 意图分类 + 标准词库;数据量大 索引、分页、复杂查询降级。
D. 培训出题 · RAG(2025.10—2026.02)
1 分钟:
五大类题库用 RAG 检索 + 分类 Prompt 自动出题,准确率 ≥98%,出题效率提升约 90%。规则是 无检索不出题,避免模型凭空编题;内容有 敏感词过滤和抽检。
追问:防跨类 → 检索带类别标签 + Prompt 锁类别;题库更新 → 增量入库。
必背E. 隐患分类与派单 Agent(2025.09—2026.02)⭐ 建议备选一个
1 分钟:
现场隐患以前 30 分钟 才能分类派单。这个 Agent 不用知识库,靠 强规则 Prompt 输出 固定 JSON(类别、责任部门、紧急程度),审核员 确认后才写入工单——典型 Human-in-the-loop。分类 准确率 ≥95%,整体 1 分钟级。
追问:为什么必须人工确认 → 央企安全责任,AI 不能直接改生产工单;JSON 怎么对接 → Schema 固定 + 和 IMS 的适配层。
F. 缺陷闭环跟踪 Agent(2025.08—2026.02)
1 分钟:
跟踪缺陷工单状态,识别 逾期,自动 催办。缺陷处理周期缩短约 40%,逾期率降约 60%。催办话术和时段 可配置,避免半夜打扰。
必背G. RAG 制度智能问答(2025.08—2026.02)⭐ 建议主力
📚 RAG 一句话流程
制度类:没检索到 = 不许编
1 分钟:
央企制度多、更新快,员工常问 HR。用 RAG 做制度问答,准确率 ≥95%,制度相关咨询 降约 70%,目标是 零编造——没有检索就不答。制度更新走 增量入库;长文档 分段检索 + 多轮。
追问:注入攻击 → 输入过滤 + 审计;怎么证明没瞎编 → 引用制度片段 + 抽检 + 幻觉率指标。
H. 国能 IMS 智慧电厂(数字化 · 非 LLM)
30 秒:
这是 15 大模块的数字化平台,数据中台、千人 100% 使用。 AI Agent 是同期独立做的 6 个子项目,不要混成「整个 IMS 都是大模型」。
I. 金不换 ERP / 谦玛 HR(备用)
30 秒:
金不换是集团 业财一体 ERP,分公司从 24 扩到 32 家;谦玛做过 人事 11 模块 0-1 的传统 HR 系统。2025 年 才把人事查询做成 NL2SQL Agent,老系统经验是 数据和流程功底,不是 LLM。
不用背ERP 若深挖:最难是 多分公司口径统一;用 BPR + 标准产品 + RICE 砍定制;和金蝶税友 标准接口 + 字段映射。
附6 · 大模型基础
上下文窗口:模型一次能读多长的内容;太长就要 RAG 或摘要,不能硬塞。
对齐(Alignment):让模型输出符合人类价值观和安全要求;RLHF 是常见训练手段,产品侧更多关注 上线后边界和评测。
基座 / 微调 / Prompt:基座是通用大模型;微调用数据改模型权重;Prompt 是改指令—— 我们项目以 Prompt + RAG 为主,迭代最快。
零样本 / 少样本:不给例子或给几个例子在 Prompt 里;分类、格式控制里常用 少样本示例。
涌现:模型变大后偶发新能力;产品上 少吹概念,多测场景。
不用背Transformer / 注意力:知道是主流架构即可;面试 不必展开数学,被问就说「了解原理,工作重心在场景和评测」。
附7 · 行为面
最大挑战:C 端要在 效果和 Token 成本 间平衡 → 模型分档和降级;B 端要在 效率和安全 间平衡 → Human-in-the-loop。
失败或延期:ERP 早期定制过多导致延期 → 后面用 标准产品 + RICE 砍需求,这个思路也用在 AI:先 MVP 一个场景,再扩。
跨部门协调:国能做过 6 部门访谈、12 场培训,IMS 使用率 100%;AI 项目同样要先 对齐指标和合规 再推。
和研发分歧:用 Bad Case 列表和指标 对齐,不用「感觉不准」;我懂技术,能一起查日志。
为什么离开/看机会:按真实情况说;可强调 已完成国能 Agent 交付,希望在 AI PM 方向持续深耕。
年龄 / 35 岁 / 1990 年:见 块 1「年龄偏大」追问——AI 专业能力 + 业务落地/管理/交付/沟通(与年轻人 互补);收尾可接「考我某个 Agent 怎么拆工作流」。
项目只有 C 端链接:见 块 1「后台呢」追问——C+B 全模块原型 + 接口文档;保密原因未公开后台,面试可展示。
附8 · 反问
- 贵司 AI 产品是 自研编排还是 Dify/Coze 这类平台?我入职后大概多久能独立负责一条 Agent 线?
- 当前 最想解决的 1 个 AI 场景 是什么?成功指标怎么定?
- AI 产品和算法/后端 多久做一次 Bad Case 复盘?
- 未来半年更偏 B 端 Agent 还是 C 端应用?和我经历哪块更匹配?
附9 · 考前 30 分钟清单
- 分库分表 → 数据源路由
- 亿级数据 → 索引+分页+复杂查询降级
- 敏感成本 → 行级权限+脱敏+审计
- 检索 50% / Prompt 30% / 知识库 15% / 模型 5%
- 优化:重分段、调检索、禁止编造、增量更新
- 术语 40% / Prompt 35% / 边界 20% / 格式 5%
- Prompt 45% / 定义 30% / 上下文 20%
- 检索 50% / Prompt 25% / 知识库 20%
- 最难:24 家分公司口径统一
- BPR:四大流程去冗余上线
- 微服务:模块独立迭代
- 金蝶税友:标准接口+字段映射
- 成果:数据互通、流失率降、32 家分公司
附10 · 项目深挖 Bad Case
以下为你原稿中 燃料/培训/隐患/缺陷/制度/ERP 的「基础追问+进阶深挖+Bad Case 分类」,内容有效,不必全背,面试前按项目 扫一眼粗体问题 即可。
燃料 NL2SQL · 进阶(节选)
培训 RAG · Bad Case 分类
隐患 Agent · Bad Case 分类
缺陷 Agent · Bad Case 分类
制度 RAG · Bad Case 分类
金不换 ERP · 高频 13 问
文档版本:2026-06 · 口语版 v2 · 对齐 马凯强-AI产品经理 (3).pdf · 含 Agent 记忆/MCP 设计题 · 必考 60 题
文档版本:2026-06 · 口语版 v3 · 背诵顺序版 · 抖音 Agent Memory 已并入块 2-1