绿条 = 要背口语 绿胶囊 = 第一/第二/收尾 黄底 = 关键数字 灰底 = 口径·不用念 蓝条 = 问法 琥珀卡 = 口诀脚手架 🃏 点题目展开答案 · 手机用底栏跳转

马凯强 · 面试背诵稿(从上到下背 · 2026)

对齐简历:马凯强-AI产品经理 (3).pdf · 目标:面试拿 offer 用法:从下一行开始,严格从上到下背。 背完 块 1→2→3→4 再翻第二阶段。

本稿格式(块 4 及问答区统一)

样式什么意思
粗体题号、小节名、关键数字——扫一眼即可,不必整句背
正文要背的口语,面试里直接照着说
斜体提示、不用背、心里记住、跳转到别章
【口诀】背稿脚手架(口诀→图像锚点→再扩绿条口语)——面试不念

背诵路线图(就按这个顺序)

顺序内容时间
1块 1自我介绍 120 秒(含常见追问:Dify · 年龄 · 后台原型)第 1 天
2块 2Agent 记忆 + MCP第 1~2 天
3块 3人事 NL2SQL + 制度 RAG,各 1 分钟第 2~3 天
4块 460 题 · 每次练一个分类约 10 题第 3 天起
第二阶段定位题、技术词、其他项目、行为面… 查阅用块 1~4 背熟后

心态(块 4 第 60 题):背题是为了 有词可说,真正主场是 国能 6 个 Agent + AI 简历优化 两个项目——答不上概念题时,先分清 国能 ToB 还是 简历 0-1,再拉回「我在那个项目里是这么做的…」


背诵方法 · 口诀 + 3-4-3(不用念给面试官)

这是背稿训练法,面试时不要说出来。

3-4-3 读熟节奏(每块目标约 10 遍)

  • 1~3 遍 · 顺句读:只念通顺;卡壳词(RAG、MCP、五层安全…)标出并 单独念 5 遍
  • 4~7 遍 · 断句读:按「第一 / 第二 / 收尾」或「层一 / 层二」停在断点处
  • 8~10 遍 · 脱稿读:只看 块口诀 + 图像锚点;卡壳 只回看那一句,不从头重读整段

核心数据打包(考前 30 秒默写)

数字记法在本稿哪里
95%回答准确率 · 查询成功率 · 隐患分类
70%制度/人事 人工咨询量下降(两项目都有)
60%FAQ 分流后 Token 下降
100%制度/人事类 自助化率

口诀: 95 准 · 70 降 · 60 省 · 100 满

每日 10 分钟巩固

  • 早 5 分钟:合上书背完全部 块口诀;默写 95 / 70 / 60
  • 晚 5 分钟:随机抽 1 块,用 图像锚点 闭眼回忆;块 4 用闪卡大声答约 10 题
  • 考前 30 分钟:只扫 口诀 + 上表 + 附9 清单,不读全文

断点不卡壳(录音法)

  1. 每块用手机 录一遍脱稿
  2. 回听标 卡壳断点,为该句编 迷你口诀(例:MCP 产品职责 → 清单·说明书·监控·安全·确认
  3. 遮挡练:盖住稿中黄底数字,只看空白说出

块 1

自我介绍 · 第 1 天(约 5 分钟)

【口诀·块1】不念给面试官 · 先口诀再扩绿条
口诀35岁14年,国能6Agent,简历0-1全
图像锚点时间轴叠积木 — ERP/OA(24→35家)→ 国能 6 款 Agent → 简历 PRD+39 页+后台
拆解35岁 · 14年ToB · 6 Agent(RAG/NL2SQL…)· 简历 0-1 全链路
练法闭眼念口诀 → 扩成三段(数字化 / 国能 / 简历)→ 再填绿条口语

块 1 · 120 秒自我介绍(必背 · 可直接念 · 对齐简历)

大家好,我叫马凯强,35 岁,在广州,14 年 ToB 产品经验Java 开发工程师出身,求职 AI 产品经理,期望在广州发展。

2012 到 2025 年 4 月,我主导 业财一体化 ERP、移动 OA、财税知识付费10 多款 集团级产品从 0 到 1,擅长复杂流程、数据治理和跨系统集成,带过团队;在金不换支撑分公司从 24 家扩张至 35 家,千人组织 系统使用率 100%——这段是 数字化项目,不是 AI 项目

2025 年 5 月到 2026 年 2 月,我在金安尚科技驻场国能肇庆,基于 Dify 从 0 搭建 6 款集团级 AI AgentRAG 知识库问答自然语言 SQL 数据查询(人事、燃料)、培训出题、隐患分类派单、缺陷闭环跟踪。我负责需求拆解、工作流编排、Prompt 工程、Bad Case 复盘和效果评估。上线后制度/人事类咨询 自助化率 100%,人工咨询量 下降约 70%,回答准确率 ≥95%;数据查询从 小时级到秒级,查询成功率 ≥95%;隐患分类 ≥95%,配合 人工确认后再生效

2026 年 2 月 项目交付离职后,我独立推进 C 端 AI 简历优化助手(0-1)PRD v1.3.2(含 AI 专章)、39 页 C 端小程序高保真原型 + 全模块 B 端运营后台原型(用户服务、套餐 SKU、课程 CMS、提示词/文案/能量点/风控审计等,含接口字段与验收说明),以及研发交接包;用 Cursor 做端到端产品验证,主路径约 15 分钟 从摸底到导出 PDF。

我的优势是 研发背景 + 14 年 ToB 落地 + 近一年 Agent 全链路,能和算法、后端一起把 AI 产品 做准、做稳、可审计。谢谢。

口径口径(心里记住,不必念出来)2025.05 前 只讲 ERP/OA/数字化;2025.05 起 才讲 LLM/Agent。简历里的 RAG 就是「先查制度库再回答」;NL2SQL 就是「说人话查数据库,只读、有权限」。


常见追问:为什么用 Dify,不做一个「AI 对话框」让用户直接问?

问法:「为什么不接个大模型聊天框?」「ChatGPT 套壳不行吗?」

💬 你可以这样答

我们早期也对比过 「一个对话框 + 大模型」,但在国能这种 央企 ToB 场景,单靠聊天框不够,原因很实在:

第一,业务不是一问一答。

制度问答要先 检索知识库,没有命中就不能编;人事查数要 生成 SQL → 校验危险语句 → 只读库 → 按人做行级权限 → 再用人话总结;隐患要 输出固定 JSON → 人工确认 → 才写入工单。这是 一条工作流,不是一轮对话能兜住的。

第二,企业要能管、能查、能回滚。

我们要 Prompt 版本、Bad Case 复盘、FAQ 分流降 Token、异常转人工、操作审计。Dify 这类编排平台,让产品和研发能 可视化拆节点、快速改流程;纯对话框要把这些全塞进前后端自研,周期和运维成本都更高

第三,成本和准确率。

比如人事 Agent,高频问题走 FAQ 本地匹配,复杂问题才调大模型,Token 60% 以上。单纯对话框往往 每问都调大模型,贵,还不一定准。

收尾

所以我的选型逻辑是:场景简单 → 对话或 FAQ 够用;场景复杂 → 工作流 + 检索 + 工具。Dify 是当时的 落地载体,不是唯一答案;若贵司有自研 Agent 平台,我照样按 流程、权限、评估 这套产品方法设计。C 端简历也不是聊天框,而是 分步骤的主路径 + 后台可配,道理一样。


常见追问:年龄偏大 / 1990 年 / 35 岁还做 AI 产品吗?

问法:「你年龄不小了」「1990 年的,跟得上 AI 吗?」「我们更想要年轻人」

💬 你可以这样答

我理解您关心的是 能不能把 AI 产品落地、能不能长期稳定交付,我正面回答。

第一,岗位要的是「做准、做稳、可审计」,不只是追热点。

Java 出身 + 14 年 ToB,在国能把 6 款 Agent 从需求做到上线指标;C 端简历也是 PRD → 原型 → 后台配置 → 研发发包 全链路。AI PM 很多难点在 权限、合规、Bad Case、跨部门对齐——这些靠 项目经验,不靠年龄小。

第二,我在 AI 上不是「旁观者」。

2025 年 5 月起 全职做 LLM Agent(RAG、NL2SQL、工作流、Prompt 迭代);离职后 独立推进 C 端 0-1,工具用 Cursor,方法和国能同一套:指标、评测、成本、Human-in-the-loop

第三,年龄对应的是企业落地必需、但很难短期练出来的能力。

年轻同事往往 工具学得快、想法新;我这边补的是 14 年 ToB 沉淀

  • 业务落地:复杂流程、数据治理、跨系统对接,知道什么该先做 MVP、什么不能省;
  • 管理与交付:带过团队、扛过 24→35 家 扩张和金不换 100% 使用率,国能 6 款 Agent 按期上线
  • 沟通与推动:国能做过 6 部门访谈、12 场培训,能把业务、研发、合规 拉到同一张验收表上

大模型可以换、平台可以换,但 AI 进企业 最后卡在 对齐指标、过合规、推上线、守运营——这些正是我的强项。

收尾(不卑不亢)

我不是和年轻人比「谁更会用新工具」,而是 AI 能力 + 企业落地能力 一起带进来。若贵司偏 B 端 Agent / 合规 ToB,这套组合是匹配的;您也可以直接考我 某个场景怎么拆工作流、怎么定指标——用专业说话。

口径口径(心里记住):不道歉、不贬低年轻人(可说「年轻同事工具学得快」);强调 互补 而非 替代1990 年 ≈ 35 岁,与自我介绍一致即可。


常见追问:项目链接里怎么只有小程序,后台呢?

问法:「你这项目是不是只做了前端?」「运营后台在哪?」

💬 你可以这样答

不是只做 C 端。我交付的是 C 端 39 页 + 全模块 B 端运营后台原型,后台覆盖 留言/退款、用户 360°、订单与 SKU、课程 CMS、提示词与系统文案、邀请增长、数据大屏、审计与风控 等;每页有 dev-spec、接口 METHOD/path、字段映射和验收路径,研发可以 仅凭文档联调

公开链接因项目保密,目前只放了 C 端演示;后台和完整接口包 面试时可以现场打开(本地 HTML 原型 + 交接文档),或按模块给您 口述清单。我角色是 产品经理,原型是 Vibe Coding 验证;正式上线仍要研发工程化,但 后台怎么配、接口怎么定 是我输出的。


块 2

Agent 记忆 + MCP · 第 1~2 天

【口诀·块2】不念给面试官 · 先口诀再扩绿条
口诀记忆分四层,MCP 是插座
图像锚点四层抽屉(工/短/中/长期)+ 插座板插 SQL、RAG、工单
拆解四层=工作→短期→中期→长期 · 面试答法收敛 三层(会话/业务库/偏好)· MCP=统一协议,国能用 Dify 工具节点
迷你口诀MCP 产品 → 清单·说明书·监控·安全·确认

块 2-1 · Agent 长期记忆 / Agent Memory(必背)

问法:「你们 Agent 有记忆吗?」「如果要跨会话记住用户,你怎么做?」

【先背 · 30 秒 · 框架】

Agent 记忆我一般分 四层 来讲:

工作记忆:当前这轮对话 + 刚调工具返回的结果,都在 上下文窗口 里,满了就要摘要或丢弃。

短期/会话记忆:本会话里用户说过什么、槽位填到哪(工号、部门、时间范围),保留最近 N 轮。

中期记忆(可选):一个 长任务跨多轮 但还没结束,比如缺陷跟踪「上次催办到哪了」——用 任务 ID + 状态表 存,不必塞进模型脑子。

长期记忆(跨会话):再拆两种——情景记忆(某次具体事件,带时间);语义记忆(稳定偏好和事实,比如「默认查近 30 天」「喜欢表格展示」)。长期记忆要 写入时抽取摘要、向量或结构化入库;读取时检索相关片段注入 Prompt,还要有 过期/删除/用户可导出

【再背 · 2 分钟 · 面试主力答法(ToB + 国能实线)】

💬 你可以这样答

我会把记忆分成 三层,不会一上来就让大模型「记住用户一切」。

第一层:短期记忆(会话内)

就是这一轮对话里,用户说了什么、Agent 查到了什么、执行到哪一步。做法通常是 保留最近 N 轮对话 + 关键槽位,比如工号、部门、时间范围、当前工单号。我在 人事 NL2SQL、缺陷跟踪 里主要用这套,够应对连续追问。

第二层:业务记忆(推荐 ToB 默认用这个)

我不建议让模型「脑记」业务数据,而是 系统查业务库:上次工单状态、考勤结果,用 用户 ID / 工号 关联查询。这样 更准、可审计、也好做权限。国能央企场景,我们 跨会话长期记忆没上线,很大原因是 隐私、等保、审计;用业务库替代,效果上用户该查到的还是能查到。

第三层:产品长期记忆(用户偏好)

比如用户喜欢表格展示、常问的三类问题、默认时间范围——这才需要 单独存 User Profile。产品设计时我会先定四件事:

  • 记什么:只记和产品相关的偏好,不记敏感原文
  • 不记什么:薪资、处分、未授权字段一律不进入记忆
  • 记多久:过期自动删;用户可 查看、导出、删除(对齐个保法)
  • 怎么用:每次对话 检索相关记忆片段注入 Prompt,而不是把全部历史聊天记录塞进去

和研发的分工:Profile 表结构、加密、检索策略研发实现;我出 PRD:字段、授权流程、兜底话术、评估指标

怎么评估:看 用户是否少重复说一遍、任务成功率是否提升;还要看 误记率、隐私投诉——长期记忆记错了比没有记忆更伤。

收尾(诚实 + 自信)

国能项目因合规 没上第三层;若贵司要做,我可以按上面框架从 小范围试点 开始,比如只记「默认查询时间范围」,验证后再扩。



块 2-2 · MCP(必背)

问法:「了解 MCP 吗?」「我们工具很多,怎么接 Agent?」

💬 你可以这样答

MCP(Model Context Protocol)可以理解成 大模型连接外部工具的「统一插座」。以前接日历、数据库、企业微信,每家一套接口;MCP 让工具以 标准 Server 形式暴露,模型通过协议调用, 便于扩展和治理

国能现场:我主要用 Dify 的工具节点、HTTP 插件、代码节点,没有以 MCP 名义上线,但 产品职责是一样的——定义 Agent 能调哪些工具、输入输出 Schema、超时重试、权限和审计。

如果贵司要上 MCP,我作为 AI PM 会做这些事

  1. 工具清单:哪些给 Agent 用,哪些不给(最小权限)
  2. 每个工具的「产品说明书」:干什么、失败提示、是否需用户确认
  3. 和现有编排的关系:Dify/自研 Agent 框架里 MCP Server 怎么注册
  4. Bad Case 与监控:哪个工具调用失败最多、Latency 如何
  5. 安全:敏感工具必须 Human-in-the-loop 或二次鉴权

诚实边界:我 还没在生产环境主导 MCP 选型,但 6 个 Agent 的工具编排、降级、复盘我都做过, 迁到 MCP 主要是工程协议层变化,产品方法论是通的。入职后我会优先熟悉贵司现有 MCP 规范和一条业务线试点。



块 3

两个主力项目 · 第 2~3 天(各 1 分钟)

【口诀·块3】不念给面试官 · 先口诀再扩绿条
口诀人事秒级查数,制度零编造答
图像锚点数据库+五把锁(NL2SQL)· 制度书+放大镜+禁止符(RAG 零编造)
拆解NL2SQL=只读SQL+五层安全+FAQ · 成功率≥95%、咨询降约70%、秒级 · RAG=没检索不答+准确率≥95%
练法各 1 分钟稿脱稿各录一遍,追问只扫 bullet 不背全文
面试说「介绍一个项目」→ 优先讲这两个。背熟下面两段 1 分钟稿,追问扫一眼即可。

块 3-1 · 企业人事智能查询 · NL2SQL(2025.11—2026.02)⭐ 建议主力

1 分钟

员工以前查人事数据要找 HR,口头描述需求,HR 再查系统,慢而且占人力。我用 Dify 搭了 NL2SQL Agent,员工用自然语言提问,系统生成 只读 SQL 查人事库,再用白话总结。安全上做了 五层:参数校验、FAQ 分流、SQL 拦截、只读库、行级权限。高频问题走 FAQ 本地匹配,Token 成本降了 60% 以上。上线后 HR 咨询量降约 70%,查询 成功率 ≥95%,基本 秒级 返回。

追问 · 口语答

  • SQL 注入和数据安全?

只用 只读账号;执行前拦截 delete、update、drop 等;SQL 在代码节点里校验;敏感字段按 员工/部门负责人/管理员 三级权限;操作有审计日志。

  • 业务人员说的黑话、口语部门名怎么懂?

维护 业务别名表和口径字典,Bad Case 里口语化问题会反哺这张表;口径变更时 改字典、灰度验证,尽量不动代码。

  • 和 ChatBI 有什么区别?

我们 限定人事域,强合规、强权限,不是开放分析平台;目标是 HR 咨询降负,不是随便拖表。

  • 举一个不满意的 Bad Case?

比如用户说「综合部人数」,系统映射错部门 → 我们补别名、加确认话术「您指的是 XX 部门吗?」→ 回归测试同类问法。



块 3-2 · RAG 制度智能问答(2025.08—2026.02)⭐ 建议主力

1 分钟

央企制度多、更新快,员工常问 HR。用 RAG 做制度问答,准确率 ≥95%,制度相关咨询 降约 70%,目标是 零编造——没有检索就不答。制度更新走 增量入库;长文档 分段检索 + 多轮

追问:注入攻击 → 输入过滤 + 审计;怎么证明没瞎编 → 引用制度片段 + 抽检 + 幻觉率指标



块 4

必考题 60 题 · 第 3 天起(每次约 10 题)

【口诀·块4】不念给面试官 · 先口诀再扩绿条
口诀RAG十二、SQL八、Agent十五、Prompt十、通用十、工具五
图像锚点六格卡片盒 — 📚RAG · 🗄️NL2SQL · 🤖Agent · 📜Prompt · 👥通用 · 🖱️工具
拆解1~12 RAG · 13~20 NL2SQL · 21~35 Agent · 36~45 Prompt · 46~55 通用 · 56~60 工具
练法每次 1 分类约 10 题 大声答;答不上先分清国能/简历,再回块 2/3
格式见文首「本稿格式」:粗体=题号 · 正文=要背的口语 · 斜体=不用背
建议练习顺序(和块 2、3 最贴): ① 二、NL2SQL(13~20) → 接块 3-1 人事 ② 一、RAG(1~12) → 接块 3-2 制度 ③ 三、Agent(21~35) → 接块 2 Agent 记忆/MCP ④ 再练 四、Prompt(36~45) · 五、通用(46~55) · 六、工具简历(56~60) 不必 60 题全文背诵,每次大声答 10 题即可。
题 1~12

一、RAG 与知识库(1~12)


题 13~20

二、NL2SQL 与数据 Agent(13~20)


题 21~35

三、Agent 与工具(21~35)


题 36~45

四、Prompt · 模型 · 成本(36~45)

两个 AI 项目别混:国能是 6 款 ToB Agent;AI 简历优化是离职后独立 0-1。

Bad Case 是什么?怎么用?

常夹在幻觉、迭代、和算法协作里问。

就是答错了、用户不满意、业务不认账的真实例子,要记下来当错题本,不能只说「感觉不准再优化」。

怎么用:收集(日志、工单、业务反馈)→ 分类(检索、Prompt、权限、别名、模型)→ 找根因 → 改 → 同一批错题再测,看同类错误有没有降下来。

举例:国能人事口语部门名查不对,就补业务别名表;制度跨章节漏召回,就调 chunk 和混合检索;简历项目夸大经历,就 Prompt 禁止编造并单列一类每周抽检。详表见附3 §6、附10。

制度问答:没检索到就不答,还要带引用。分类和 SQL:低温度、固定 JSON 格式。NL2SQL:拦截危险语句、结果对账。隐患:人工确认后再入库。简历:提交前校验禁止编造。所有场景:错题本改完要回归测。

国能人事高频问走 FAQ 本地匹配,不调大模型,Token 能降六成以上。长对话做缓存或摘要,别重复喂全文。简历项目复杂步骤用标准版、简单步骤用基础版,预算触顶自动降级。还要限流防刷,RAG 只喂相关段,别整库塞进 Prompt。

用 RAG 只检索相关段;多轮对话保留最近几轮加摘要;NL2SQL 只给相关表结构和口径;简历 OCR 合并太长就截断并提示;缺陷跟踪只加载当前工单时间窗,不拉全厂历史。


题 46~55

五、AI 产品经理通用(46~55)


题 56~60

六、Vibe Coding · 工具 · 简历(56~60)



📚
第二阶段

块 1~4 背熟后再看 · 查阅 / 加餐

以下 不用按顺序全文背。面试前 30 分钟可扫 附9 考前清单;被问到再翻 附2 定位题、附3 技术词
【口诀·附2+附3】不念给面试官 · 先口诀再扩绿条
口诀转AI有落地,分工有边界;RAG搜、SQL查、Func调、MCP联
图像锚点三角(国能 / 简历 / 14年ToB)+ 四插头插座板(技术词)
拆解附2=定位6题查阅 · 附3=15技术词点名再翻 · 块1~4背熟后再扫
练法考前30分钟扫口诀+附9;面试中被问再展开,不抢在块1~4前面背

附1 · 面试地图(一场面试四段话用哪一块)

面试官在问什么用哪一块
自我介绍 / 为什么转 AI PM块 1 + 附2
Agent 记忆、MCP、ReAct、怎么设计块 2 + 附4
介绍项目、RAG、NL2SQL、Bad Case块 3 + 附5
概念题、RAG 流程、Prompt、成本块 4 + 附3
行为面、离职原因、挑战附7
反问附8

附2 · 定位类 6 题

1. 为什么转 AI 产品经理?

问法:你为什么做 AI PM?是不是跟风?

💬 你可以这样答

我不是去年才开始接触 AI。之前十几年一直在做 ToB,ERP、OA、人事系统、数据治理都做过,擅长把业务流程和产品落地。2025 年 5 月起在国能肇庆,我从 0 参与设计了 6 款 Agent 上线,制度 RAG、人事和燃料 NL2SQL、培训出题、隐患派单、缺陷跟踪都有,从需求、工作流、Prompt、评估到 Bad Case 复盘我都负责。2026 年又独立做了 C 端 AI 简历产品,PRD、原型、运营后台、研发交接都走完了。所以转 AI PM 是有项目支撑的,不是只看热闹。


2. 你和算法 / 后端怎么分工?

问法:AI 产品和技术怎么配合?你会不会只是写 PRD?

💬 你可以这样答

我定场景、用户路径、成功指标,还有 Prompt 和工作流怎么编排、什么必须人工审核、Bad Case 怎么闭环。算法和后端负责模型选型、向量库、SQL 引擎、权限和性能。我开发出身,能看懂接口和日志,联调时不会对扯皮。举个例子:人事 NL2SQL 里「部门口语化查不对」,我会和研发一起看是别名表问题还是 Prompt 问题,改完用同一批测试题验证,而不是只说「效果不好再优化」。


3. 你学的是不是皮毛?抖音那些 Agent 记忆、MCP 你懂吗?

问法:感觉 AI 变化很快,你跟得上吗?

💬 你可以这样答

我不靠背论文,我靠落地。每个 Agent 都有准确率、自助化率、Token、幻觉这些指标,还有每周抽检和 Bad Case 表。抖音上的 Agent 记忆、MCP,我理解概念,也清楚产品该怎么设计——国能因为央企合规,跨会话长期记忆我们没上,用的是业务库加会话上下文;MCP 我现场用 Dify 工具节点,原理一样。如果贵司要用 MCP 或长期记忆,我可以按 块 2 那套思路讲怎么设计,和我现有经验是接得上的。


4. 2018 年以前的 ERP 还要讲吗?

问法:你简历很长, oldest 的项目和 AI 有什么关系?

💬 你可以这样答

老项目证明我有 ToB 基本功:复杂流程、多组织、数据口径、跨系统集成、带团队。AI 能力从 2025 年 5 月 国能 Agent 才开始写。面试时老项目我讲数字化成果;AI 细节只绑 Agent 和 C 端简历,不会把 ERP 说成 AI 项目。


5. 期望薪资 30~35K 的依据?

问法:你的期望为什么是这个区间?

💬 你可以这样答

结合广州市场和岗位:14 年 ToB 产品经验、带团队、研发背景,加上近一年 6 款 Agent 从 0 到上线,以及 C 端 0-1 的 PRD 和原型交付。我更看 能力匹配能独立负责 AI 场景,具体可以聊。


6. 你日常用哪些 AI 工具?(抖音常问)

问法:你平时用什么 AI 工具?

💬 你可以这样答

工作流编排用 Dify 做 Agent;产品验证用 Cursor 做 Vibe Coding,C 端 39 页原型很多是这样快速搭出来再交给研发的;文档和 PRD 用大模型辅助写结构和润色,但业务规则、指标、合规我自己定稿;协作用常规办公和项目管理工具。工具会变,关键是 场景、指标、Bad Case 这套方法不变。



附3 · 技术词查阅(15 个)

用法:面试官 点名某个词 时用本章;若他说「讲讲你做的制度问答」,直接去 第五章 G,别整章背。 结构什么时候答不用背)→ 正文(要背的口语)→ 结合项目(有则背)→ 常见追问(被追问再看)。 面试官不懂英文时:先说「就是……」人话,再讲项目里哪一步,别只堆 RAG、HITL 等缩写。 项目别混:国能 = 6 款 ToB Agent(文本);AI 简历优化 = 独立 0-1(含 OCR/多模态)。

1. RAG(检索增强生成)

不用背什么时候答:简历写了制度问答 / 培训出题;或问「怎么防幻觉」「知识库怎么建」。

RAG 就是先查资料再回答。大模型自己编容易瞎说,我们先从制度库、题库里检索相关段落,再让模型只根据检索到的内容组织答案,这样私有知识能更新,幻觉也会少很多。

结合项目

在国能我做了两个 RAG:制度问答培训出题。制度是按章节切分,有重叠,再向量检索,Prompt 里写死「没有检索结果不许编,要引导找人工」。培训出题是在五大题库里按类别检索,再出题,避免跨类、避免编造。

常见追问 · 口语答

  • Chunk 怎么切?

按制度章节或条款切,一段大概 200~500 字,相邻段 重叠 10%20%,避免一句话被切两半导致搜不到。

  • 召回率低怎么办?

先看是切分问题还是检索问题:可以 混合检索(向量 + 关键词),加 Rerank 精排,调 Top-K;Bad Case 里把「搜不到的问法」收集起来专门测。

  • 没搜到还回答怎么办?

产品规则就是 不许编。返回「未找到相关制度,建议联系 XX 部门」,并留人工入口;这在我们央企场景是硬要求。

  • 怎么评估效果?

回答准确率、幻觉率、引用是否命中;每周抽一批问题盲测,业务方也会参与抽检。


2. NL2SQL(自然语言查数)

不用背什么时候答:人事 Agent、燃料 Agent;或问「ChatBI」「Text2SQL」「数据安全」。

NL2SQL 就是员工说人话,系统生成只读 SQL 去查业务库,再用自然语言总结结果。适合考勤、编制、燃料消耗这类结构化数据。

结合项目

人事和燃料两个 Agent 都是 Dify 工作流。前面有意图识别和业务别名(比如口语「综合部」映射到标准部门名),中间生成 SQL,后面 五层安全:参数校验、FAQ 分流、SQL 危险语句拦截、只读库、行级权限。人事高频问题走 FAQ,Token 能降 60% 以上

常见追问 · 口语答

  • 表太多怎么办?

限定主题域(人事一套、燃料一套),给模型 Schema 摘要和别名表,不要一次扔几百张表。表特别多时,可以加一步「先推荐 Top 相关表」再生成 SQL——产品上要定义推荐错了怎么兜底。

  • SQL 错了怎么办?

执行前 语法校验、拦截 delete/update 等;执行后 结果抽样、空结果/异常量告警;错例进 Bad Case,改 Prompt 或补别名,不是只改模型。

  • 和 RAG 有什么区别?

RAG 查文档(制度 PDF、Word);NL2SQL 查数据库表。我们制度用 RAG,人事编制用 NL2SQL,选型看数据在哪。


3. Function Calling / 工具节点

不用背什么时候答:问 Agent 怎么执行动作、怎么调 API、Dify 里工具节点是什么。

Function Calling 就是模型不只会说话,还能决定调用哪个工具,比如查库、算数、调 HTTP 接口,拿到真实结果再继续推理。在 Dify 里我主要用工具节点和代码节点实现,和 Function Calling 是一类能力。

结合项目

人事 Agent 里:FAQ 匹配、权限校验、SQL 执行、结果格式化都是节点;隐患 Agent 里输出固定 JSON 给工单系统。产品上要定义 每个工具输入输出、失败怎么办、谁有权限调

常见追问

  • 工具调用失败?

重试 1~2 次 → 换降级话术 → 转人工;日志里要能看到 哪一步失败,方便 Bad Case。

  • 和 MCP 什么关系?

MCP 是 接工具的统一协议标准;我在国能用 Dify 插件/HTTP 工具, 产品思路一样。MCP 怎么选型见 块 2-2


4. Human-in-the-loop(人在回路)

不用背什么时候答:隐患派单、缺陷跟踪;或问「AI 错了谁负责」「央企能不能全自动」。

就是 AI 出建议,人点确认后才生效。安全、派单、涉责场景必须这样,不能 AI 直接改生产数据。

结合项目

隐患分类 Agent 输出类别、责任部门、紧急程度,审核员确认后才写入 IMS 工单。一开始人工多,准确率高了之后,可以只对 低置信或高风险 强制人工,用 人工介入率 看效率。

追问:会不会很慢?

首月会慢,但相比以前 30 分钟一单,AI 1 分钟出建议、人 2 分钟确认,整体还是快很多;指标上 分类准确率 ≥95% 才逐步放权。


5. 幻觉防控

不用背什么时候答:任何 AI 项目都会问;C 端简历尤其会问「会不会编造经历」。

幻觉就是模型一本正经胡说。产品不能单靠 Prompt 里写请勿编造,要检索约束、格式约束、校验、评估一起上。

结合项目

制度 RAG:无检索不回答 + 引用来源;NL2SQL:只读库 + 结果对账;分类 Agent:低温度 + JSON Schema;C 端简历:禁止编造经历 + 提交前校验 + Bad Case。目标上关键场景 宁可说不知道,也不编


6. Bad Case 复盘

不用背什么时候答:问你怎么迭代、怎么和算法协作、效果怎么持续提升;或面试官问「Bad Case 是什么?」(很多人没听过这个词)。

Bad Case,中文你就理解成错题本:答错的、用户不满意的、业务不认账的真实例子。不是骂用户,而是把这些例子当资产,用来改产品。

怎么用(五步,面试可直接说)

收集(日志、工单、HR/业务反馈)→ 分类(检索 / Prompt / 权限 / 别名口径 / 模型)→ 找根因(补别名表、调 chunk、改 Prompt、加校验)→ 同一批错题再测一遍,看同类错误率有没有下来。

结合项目(先说归属)

  • 国能·人事:「口语部门名查不对」→ 补 业务别名表
  • 国能·制度:「跨章节漏召回」→ 调 chunk + 混合检索
  • AI 简历优化:「夸大/虚构经历」→ Prompt 禁止编造 + Bad Case 单列一类 每周抽检

和算法怎么协作:你带 错题列表 + 指标 开会,不用「感觉不准」;改完必须 回归同一批题。详表见 附10 各项目 Bad Case 分类。


7. 效果评估

不用背什么时候答:问 KPI、上线后怎么盯、和老板怎么汇报。

我分三层:技术层(准确率、幻觉率、延迟、SQL/JSON 合规率)、产品层(自助化率、查询成功率、人工介入率)、业务层(咨询量降多少、审核量降多少、决策快多少、Token 花多少)。

结合项目

制度/人事 咨询量降约 70%,NL2SQL 成功率 ≥95%,隐患分类 ≥95%。上线后有 日报 + 每周抽检 + 月度业务复盘,指标掉下去当天就要查。


8. Prompt 工程 + 版本回退

不用背什么时候答:问和微调怎么选、Prompt 怎么写、线上出问题怎么回滚。

Prompt 就是给模型的岗位说明书:你是谁、干什么、不能干什么、输出什么格式。企业里还要能版本管理、能 5 分钟生效、出问题能一键回退——我在 C 端 PRD 和 B 端原型里都设计了提示词配置和回退。

和微调怎么选(口语)

知识常变、要快迭代 → Prompt + RAG 优先;格式极其固定、数据量很大、Prompt 顶不住 → 再考虑微调。国能 6 个 Agent 和 C 端简历,都以 Prompt + 工作流为主


9. Token / 成本治理

不用背什么时候答:问商业化、C 端怎么控本、企业怎么降 API 费用。

大模型按 Token 计费,产品要想少调用、用小模型、缓存、分流。

结合项目

人事 Agent:FAQ 本地匹配,高频问题不调大模型,Token 降 60%+。C 端简历:模型分档,复杂用标准版、简单用基础版,预算触顶 自动降级,界面上 不暴露模型名,只显示「标准版/基础版」。


10. Vibe Coding(Cursor)

不用背什么时候答:问你会不会用 AI 写代码、原型谁做的、和研发边界。

Vibe Coding 是产品经理用 AI 编程助手快速搭原型、验证交互和规则,不是替代正式研发。我用 Cursor 做 C 端 39 页 + B 端运营后台可点原型,对齐 PRD 和 dev-spec,研发接手时有接口和验收标准;公开链接因保密只放 C 端,后台面试可展示。

抖音说的「五层能力」(口语)

① 需求边界(PRD 里 AI 能做什么不能做什么)② Prompt 和规则 ③ 工作流和页面 ④ 异常兜底(超时、失败不扣点)⑤ 评估和 Bad Case。我 ①②④⑤ 都做过;正式上线 安全、性能、合规 仍要研发工程化。


11. Context Window(上下文窗口)

不用背什么时候答:问对话太长怎么办、制度很长怎么塞进去。

就是模型一次能读多长的内容,有上限。所以长制度不能整本塞进 Prompt,要用 RAG 只喂相关段;多轮对话用最近几轮加摘要;缺陷 Agent 只加载当前工单时间窗的信息。


12. Dify 工作流

不用背什么时候答:问你们技术栈、Agent 怎么编排。

Dify 是可视化把意图识别、检索、SQL、校验、生成串成一条链。6 个 Agent 各有一条主流程,共性节点包括:FAQ 分流、权限、异常分支、转人工。


13. AI 治理(安全 / 合规 / 成本)

不用背什么时候答:ToB、央企、C 端小程序合规。

AI 上线不只看准不准,还要看权限、审计、内容安全、成本上限。国能:只读库、SQL 注入防护、三级人事权限、操作留痕;C 端:深度合成相关合规、失败不扣能量点、分享打码等。


14. 多模态 / OCR(图片·文档·摄像头)

不用背什么时候答:问「多模态了解吗」「简历能不能传图」「OCR 谁做」。

查阅口语 30 秒:见块 4 第 43 题(背那一段即可)。查阅提示:OCR/多模态在 AI 简历优化;国能 6 个 Agent 是纯文本,口头不必对比。



附4 · 设计题 10 问(块2已背 1~2,其余查阅)

这类题 HR 和业务都会问:「我们将来要做 XXX,你会怎么设计?」 答法结构:① 先说概念(30 秒)② 说你会怎么设计(1~2 分钟)③ 诚实说国能为什么没做/你用什么替代 ④ 接一句「和我现有 Agent 经验相通」。

必背1. Agent 长期记忆怎么设计?(抖音超高频 · 必背)

🧠 Agent 记忆 · 四层框架(先背 30 秒版)

④ 长期记忆情景+语义 · 跨会话 · 要过期删除
③ 中期记忆长任务 · 任务ID+状态表
② 短期/会话最近N轮 + 槽位
① 工作记忆当前轮 + 工具返回 · 在上下文里

ToB 面试答法 → 收敛为三层:会话内 · 业务库 · 用户偏好

问法:「你们 Agent 有记忆吗?」「如果要跨会话记住用户,你怎么做?」

💬 你可以这样答

我会把记忆分成 三层,不会一上来就让大模型「记住用户一切」。

第一层:短期记忆(会话内)

就是这一轮对话里,用户说了什么、Agent 查到了什么、执行到哪一步。做法通常是 保留最近 N 轮对话 + 关键槽位,比如工号、部门、时间范围、当前工单号。我在 人事 NL2SQL、缺陷跟踪 里主要用这套,够应对连续追问。

第二层:业务记忆(推荐 ToB 默认用这个)

我不建议让模型「脑记」业务数据,而是 系统查业务库:上次工单状态、考勤结果,用 用户 ID / 工号 关联查询。这样 更准、可审计、也好做权限。国能央企场景,我们 跨会话长期记忆没上线,很大原因是 隐私、等保、审计;用业务库替代,效果上用户该查到的还是能查到。

第三层:产品长期记忆(用户偏好)

比如用户喜欢表格展示、常问的三类问题、默认时间范围——这才需要 单独存 User Profile。产品设计时我会先定四件事:

  • 记什么:只记和产品相关的偏好,不记敏感原文
  • 不记什么:薪资、处分、未授权字段一律不进入记忆
  • 记多久:过期自动删;用户可 查看、导出、删除(对齐个保法)
  • 怎么用:每次对话 检索相关记忆片段注入 Prompt,而不是把全部历史聊天记录塞进去

和研发的分工:Profile 表结构、加密、检索策略研发实现;我出 PRD:字段、授权流程、兜底话术、评估指标

怎么评估:看 用户是否少重复说一遍、任务成功率是否提升;还要看 误记率、隐私投诉——长期记忆记错了比没有记忆更伤。

收尾(诚实 + 自信)

国能项目因合规 没上第三层;若贵司要做,我可以按上面框架从 小范围试点 开始,比如只记「默认查询时间范围」,验证后再扩。


2. MCP 是什么?你们用过吗?如果要用你怎么做?

问法:「了解 MCP 吗?」「我们工具很多,怎么接 Agent?」

💬 你可以这样答

MCP(Model Context Protocol)可以理解成 大模型连接外部工具的「统一插座」。以前接日历、数据库、企业微信,每家一套接口;MCP 让工具以 标准 Server 形式暴露,模型通过协议调用, 便于扩展和治理

国能现场:我主要用 Dify 的工具节点、HTTP 插件、代码节点,没有以 MCP 名义上线,但 产品职责是一样的——定义 Agent 能调哪些工具、输入输出 Schema、超时重试、权限和审计。

如果贵司要上 MCP,我作为 AI PM 会做这些事

  1. 工具清单:哪些给 Agent 用,哪些不给(最小权限)
  2. 每个工具的「产品说明书」:干什么、失败提示、是否需用户确认
  3. 和现有编排的关系:Dify/自研 Agent 框架里 MCP Server 怎么注册
  4. Bad Case 与监控:哪个工具调用失败最多、Latency 如何
  5. 安全:敏感工具必须 Human-in-the-loop 或二次鉴权

诚实边界:我 还没在生产环境主导 MCP 选型,但 6 个 Agent 的工具编排、降级、复盘我都做过, 迁到 MCP 主要是工程协议层变化,产品方法论是通的。入职后我会优先熟悉贵司现有 MCP 规范和一条业务线试点。


3. ReAct 是什么?和你们 Dify 工作流一样吗?

💬 你可以这样答

ReAct 是 Reason(推理)→ Act(行动)→ Observe(观察结果) 再循环,直到任务完成。比如:先想「要查人事库」→ 调 SQL 工具 → 看结果不对 → 改条件再查。

Dify 工作流可以是 固定流程,也可以是 带分支的多步,和 ReAct 思想接近。我的 隐患、缺陷 Agent 更接近「多步 + 工具」; 制度 RAG 更像固定链:检索 → 生成。面试里我会说:不是所有场景都要强 Agent,问答类 RAG 够用就行, 派单、跟踪类才上 ReAct 式编排


4. RAG 和 Agent 有什么区别?你们为什么两个都做?

💬 你可以这样答

RAG 解决 「知识从哪来、怎么别瞎编」,典型是制度问答、培训出题。

Agent 解决 「多步完成任务、调工具、有状态」,典型是隐患派单、缺陷催办。

可以这么记:RAG + 对话是弱 Agent;我们 隐患、缺陷是强 Agent。选型看用户要完成 一步问答 还是 一条业务链路


5. 混合检索、Rerank 是什么?产品上要关心吗?

💬 你可以这样答

向量检索 懂语义,但有时漏关键词;关键词/BM25 对制度编号、专有名词更准。混合检索 就是两个一起用再合并结果。Rerank 是用一个小模型对 Top 结果 再排一次序,提高「喂给大模型的段落」质量。

产品上要定:召回不够时先调检索还是调 Prompt;Bad Case 里要标 是检索错还是生成错——这决定改知识库还是改模型参数。


6. Agent 怎么评估?除了准确率还看什么?

💬 你可以这样答

除了 任务成功率、回答准确率,我还看:

  • 步数/耗时:Agent 是否绕圈
  • 人工介入率:多少单必须人点确认
  • 工具调用成功率
  • Grounding:回答是否真有检索/SQL 依据
  • 业务结果:派单是否更快、咨询是否减少

C 端还会看 完成率、留存、单次 Token 成本


7. Agent 死循环 / 越跑越偏怎么办?

💬 你可以这样答

产品规则上设 最大步数、总超时、重复检测(同一步骤重复 3 次就停);给用户 明确失败提示和转人工;日志里记录 每一步决策,方便 Bad Case。不会让用户对着屏幕干等。


8. 多 Agent 协作 / 主 Agent 拆子 Agent 你怎么想?

💬 你可以这样答

业务域拆,比如「人事 Agent」「燃料 Agent」分开,不要一个 Agent 包打天下——我们国能就是这么做的。若要做「总前台」,可以是 路由 Agent 先识别意图再 分发给子 Agent,产品上要定义 交接上下文带哪些字段、失败谁兜底


9. RAG 知识库怎么构建?(抖音:骆齐那类题)

💬 你可以这样答

收资料:制度、题库、FAQ,定 owner 和更新频率

清洗:去重、去密、版本号

切分:按章节/条款,控制长度和 overlap

向量化入库

试检索 + 试回答,用 Bad Case 调 chunk 和检索策略

上线后增量更新,不是一次完事

制度更新时我们走 增量入库,不是整库推翻重来。


必背10. AI 问答不准,你怎么排查?(通用排查五步法 · 必背)

💬 你可以这样答

我固定五步,不和研发瞎猜:

  1. 检索有没有——该搜到的搜到了吗?
  2. Prompt 有没有用检索——是不是模型没用上片段?
  3. 模型参数——温度是不是太高?
  4. 权限和数据——是不是用户根本没权限看这条数据?
  5. Bad Case 是否重复——同类错误进表,改完回归

这五步在国能 每周复盘 都会用。



附5 · 全部项目(块3已背 B+G,其余查阅)

用法:面试官说「介绍一个项目」→ 选 2 个主力(建议 人事 NL2SQL + 制度 RAG,或 隐患 HITL + C 端简历)背熟 1 分钟稿;其余项目 知道 30 秒版 即可。

A. C 端 · AI 简历优化助手(2026.02—至今)

1 分钟(可直接念)

这个项目是给求职者用的 AI 简历助手,目标是用大约 15 分钟 走完摸底、初稿、JD 对齐、HR 预览到导出 PDF。我独立完成了 PRD v1.3.2,里面单独写了 AI 能力专章,包括能力边界、输入输出、质量指标、评测方法和成本安全;还做了 39 页 C 端可交互原型 + 全模块 B 端运营后台原型(用户/交易/内容/增长/数据与风控等),以及含 接口、字段、JSON 示例、验收路径 的研发交接文档。原型阶段用 Cursor 做 Vibe Coding,C 端和后台规则都是先验证再交给研发。公开演示链接因保密只展示 C 端;后台面试可现场展示。合规上按微信小程序 深度合成 相关要求做了评估,设计了失败不扣点、分享打码等规则。

追问 · 口语答

  • PRD 里 AI 专章写什么?

写清楚 能做什么、不能做什么;每个 AI 能力的输入输出;准确率/完成率等指标;怎么评测;Token 和模型分档;失败和超时怎么处理。研发不能猜。

  • 怎么防编造简历经历?

Prompt 禁止编造 + 提交前校验 + 用户确认;Bad Case 里专门有一类「夸大/虚构」;宁可提示用户补充,也不自动编一段假经历。

  • 成本怎么控?

模型分档,复杂步骤用标准版,简单用基础版;预算触顶自动降级;后台可看单次和日均 Token;用户界面 不暴露模型名

  • Vibe Coding 和研发边界?

我用 Cursor 做 原型和规则验证;上线版本的 安全、性能、支付、合规 必须研发工程化,我交付 PRD、原型、接口和 Done 定义。

  • 为什么链接里只有小程序?后台做了吗?

做了 全模块 B 端运营后台(留言退款、用户 360°、SKU/订单、课程 CMS、提示词/文案、增长、审计风控等),每页带 接口与验收说明公开链接受保密只展示 C 端;面试可 现场打开后台原型 或按模块口述。

  • 多模态 / 上传简历图 / OCR 做了吗?

做了,在 AI 简历优化里:摸底和 JD 可传图 OCR,图会压缩,失败不扣点;还有留言附图和表情摄像头。口语直接背块 4 第 43 题。


必背B. 企业人事智能查询 · NL2SQL(2025.11—2026.02)⭐ 建议主力

🛡️ 人事 NL2SQL · 五层安全(必记)

  1. 参数校验
  2. FAQ 分流
  3. SQL 拦截
  4. 只读库
  5. 行级权限

高频走 FAQ → Token 降 60%+ · 成功率 ≥95%

1 分钟

员工以前查人事数据要找 HR,口头描述需求,HR 再查系统,慢而且占人力。我用 Dify 搭了 NL2SQL Agent,员工用自然语言提问,系统生成 只读 SQL 查人事库,再用白话总结。安全上做了 五层:参数校验、FAQ 分流、SQL 拦截、只读库、行级权限。高频问题走 FAQ 本地匹配,Token 成本降了 60% 以上。上线后 HR 咨询量降约 70%,查询 成功率 ≥95%,基本 秒级 返回。

追问 · 口语答

  • SQL 注入和数据安全?

只用 只读账号;执行前拦截 delete、update、drop 等;SQL 在代码节点里校验;敏感字段按 员工/部门负责人/管理员 三级权限;操作有审计日志。

  • 业务人员说的黑话、口语部门名怎么懂?

维护 业务别名表和口径字典,Bad Case 里口语化问题会反哺这张表;口径变更时 改字典、灰度验证,尽量不动代码。

  • 和 ChatBI 有什么区别?

我们 限定人事域,强合规、强权限,不是开放分析平台;目标是 HR 咨询降负,不是随便拖表。

  • 举一个不满意的 Bad Case?

比如用户说「综合部人数」,系统映射错部门 → 我们补别名、加确认话术「您指的是 XX 部门吗?」→ 回归测试同类问法。


C. 燃料数据分析 · NL2SQL(2025.11—2026.02)

🛡️ 人事 NL2SQL · 五层安全(必记)

  1. 参数校验
  2. FAQ 分流
  3. SQL 拦截
  4. 只读库
  5. 行级权限

高频走 FAQ → Token 降 60%+ · 成功率 ≥95%

1 分钟

燃料成本分析以前靠人工导数、做表,动辄 小时级。这个 Agent 用 NL2SQL 查燃料数据,并给 分析建议,响应 秒级,帮助成本优化大约 2%5%。架构和人事类似,但 成本数据更敏感,行级权限和脱敏更严。

追问:敏感数据 权限 + 脱敏 + 审计;口语指标名 意图分类 + 标准词库;数据量大 索引、分页、复杂查询降级


D. 培训出题 · RAG(2025.10—2026.02)

1 分钟

五大类题库用 RAG 检索 + 分类 Prompt 自动出题,准确率 ≥98%,出题效率提升约 90%。规则是 无检索不出题,避免模型凭空编题;内容有 敏感词过滤和抽检

追问:防跨类 → 检索带类别标签 + Prompt 锁类别;题库更新 → 增量入库


必背E. 隐患分类与派单 Agent(2025.09—2026.02)⭐ 建议备选一个

1 分钟

现场隐患以前 30 分钟 才能分类派单。这个 Agent 不用知识库,靠 强规则 Prompt 输出 固定 JSON(类别、责任部门、紧急程度),审核员 确认后才写入工单——典型 Human-in-the-loop。分类 准确率 ≥95%,整体 1 分钟级

追问:为什么必须人工确认 → 央企安全责任,AI 不能直接改生产工单;JSON 怎么对接 → Schema 固定 + 和 IMS 的适配层


F. 缺陷闭环跟踪 Agent(2025.08—2026.02)

1 分钟

跟踪缺陷工单状态,识别 逾期,自动 催办。缺陷处理周期缩短约 40%,逾期率降约 60%。催办话术和时段 可配置,避免半夜打扰。


必背G. RAG 制度智能问答(2025.08—2026.02)⭐ 建议主力

📚 RAG 一句话流程

收文档切块 向量化检索生成

制度类:没检索到 = 不许编

1 分钟

央企制度多、更新快,员工常问 HR。用 RAG 做制度问答,准确率 ≥95%,制度相关咨询 降约 70%,目标是 零编造——没有检索就不答。制度更新走 增量入库;长文档 分段检索 + 多轮

追问:注入攻击 → 输入过滤 + 审计;怎么证明没瞎编 → 引用制度片段 + 抽检 + 幻觉率指标


H. 国能 IMS 智慧电厂(数字化 · 非 LLM)

30 秒

这是 15 大模块的数字化平台,数据中台、千人 100% 使用AI Agent 是同期独立做的 6 个子项目,不要混成「整个 IMS 都是大模型」。


I. 金不换 ERP / 谦玛 HR(备用)

30 秒

金不换是集团 业财一体 ERP,分公司从 24 扩到 32 家;谦玛做过 人事 11 模块 0-1 的传统 HR 系统。2025 年 才把人事查询做成 NL2SQL Agent,老系统经验是 数据和流程功底,不是 LLM。

不用背ERP 若深挖:最难是 多分公司口径统一;用 BPR + 标准产品 + RICE 砍定制;和金蝶税友 标准接口 + 字段映射



附6 · 大模型基础

上下文窗口:模型一次能读多长的内容;太长就要 RAG 或摘要,不能硬塞。

对齐(Alignment):让模型输出符合人类价值观和安全要求;RLHF 是常见训练手段,产品侧更多关注 上线后边界和评测

基座 / 微调 / Prompt:基座是通用大模型;微调用数据改模型权重;Prompt 是改指令—— 我们项目以 Prompt + RAG 为主,迭代最快。

零样本 / 少样本:不给例子或给几个例子在 Prompt 里;分类、格式控制里常用 少样本示例

涌现:模型变大后偶发新能力;产品上 少吹概念,多测场景

不用背Transformer / 注意力:知道是主流架构即可;面试 不必展开数学,被问就说「了解原理,工作重心在场景和评测」。



附7 · 行为面

最大挑战:C 端要在 效果和 Token 成本 间平衡 → 模型分档和降级;B 端要在 效率和安全 间平衡 → Human-in-the-loop。

失败或延期:ERP 早期定制过多导致延期 → 后面用 标准产品 + RICE 砍需求,这个思路也用在 AI:先 MVP 一个场景,再扩

跨部门协调:国能做过 6 部门访谈、12 场培训,IMS 使用率 100%;AI 项目同样要先 对齐指标和合规 再推。

和研发分歧:用 Bad Case 列表和指标 对齐,不用「感觉不准」;我懂技术,能一起查日志。

为什么离开/看机会:按真实情况说;可强调 已完成国能 Agent 交付,希望在 AI PM 方向持续深耕

年龄 / 35 岁 / 1990 年:见 块 1「年龄偏大」追问——AI 专业能力 + 业务落地/管理/交付/沟通(与年轻人 互补);收尾可接「考我某个 Agent 怎么拆工作流」。

项目只有 C 端链接:见 块 1「后台呢」追问——C+B 全模块原型 + 接口文档;保密原因未公开后台,面试可展示。



附8 · 反问

  1. 贵司 AI 产品是 自研编排还是 Dify/Coze 这类平台?我入职后大概多久能独立负责一条 Agent 线?
  2. 当前 最想解决的 1 个 AI 场景 是什么?成功指标怎么定?
  3. AI 产品和算法/后端 多久做一次 Bad Case 复盘
  4. 未来半年更偏 B 端 Agent 还是 C 端应用?和我经历哪块更匹配?


附9 · 考前 30 分钟清单


  • 附10 · 项目深挖 Bad Case

    以下为你原稿中 燃料/培训/隐患/缺陷/制度/ERP 的「基础追问+进阶深挖+Bad Case 分类」,内容有效,不必全背,面试前按项目 扫一眼粗体问题 即可。

    燃料 NL2SQL · 进阶(节选)

    • 分库分表 → 数据源路由
    • 亿级数据 → 索引+分页+复杂查询降级
    • 敏感成本 → 行级权限+脱敏+审计

    培训 RAG · Bad Case 分类

    • 检索 50% / Prompt 30% / 知识库 15% / 模型 5%
    • 优化:重分段、调检索、禁止编造、增量更新

    隐患 Agent · Bad Case 分类

    • 术语 40% / Prompt 35% / 边界 20% / 格式 5%

    缺陷 Agent · Bad Case 分类

    • Prompt 45% / 定义 30% / 上下文 20%

    制度 RAG · Bad Case 分类

    • 检索 50% / Prompt 25% / 知识库 20%

    金不换 ERP · 高频 13 问

    • 最难:24 家分公司口径统一
    • BPR:四大流程去冗余上线
    • 微服务:模块独立迭代
    • 金蝶税友:标准接口+字段映射
    • 成果:数据互通、流失率降、32 家分公司

    文档版本:2026-06 · 口语版 v2 · 对齐 马凯强-AI产品经理 (3).pdf · 含 Agent 记忆/MCP 设计题 · 必考 60 题


    文档版本:2026-06 · 口语版 v3 · 背诵顺序版 · 抖音 Agent Memory 已并入块 2-1