Anthropic 内测的 Insights 功能里,藏着一份值得抄的 LLM 反幻觉 spec

大家好,我是飞飞。
今天有人在群里转了一段 Anthropic 内测中的 Insights 功能的工程 spec 给我。Insights 是 Anthropic 给 Claude Console 上的 Managed Agents 用户做的”跨 session 分析”工具,目前还在测试阶段,主流媒体没正式覆盖。
但我读完那段 spec 之后觉得它比 5 月 6 日 Code with Claude 大会上发布的那几个旗舰功能(Dreaming、Outcomes、Multiagent Orchestration)都更值得写一篇。
理由:这是我最近半年看到的 LLM 应用层最干净的一份”反幻觉架构”spec。普通开发者写自己的 LLM 应用如果遇到”跨数据点做 cross-record 分析”这类需求,几乎可以照着这套架构抄。
下面把这段 spec 拆开讲,重点不在新闻本身,在它的设计哲学。
先把 Insights 这个功能的机制描完
把用户给我的那段 spec 翻译成中文摆出来,再讲解读。
整个流程从抓 session 开始。Anthropic 抓你这个 Managed Agent 最近最多 100 个 session。
抓完之后进入并行 summarize。每条 transcript 单独发给模型(4 路并行),上下文里带上你这个 agent 的 system prompt。模型为每个 session 写一份 summary,字段包括 task(这个 session 在干啥)、actions(agent 做了哪些动作)、issues(有什么问题)、assessment(整体评价)。再额外打一个 0 到 100 的 quality score。









