夸克用Agent思路，做了一个健康大模型

葬AI·2025年7月24日

数据-技术-产品，闭环的产品思路

「数据-技术-产品闭环」

最近让我印象深刻的产品，是夸克的健康大模型。

垂直大模型的故事大伙听太多了，无非是基模+知识库。如何更进一步，让大模型学习专业人士的思考方式，更准确地生成内容？

夸克的解决方案，给了我非常多启发。

夸克是直接让大模型产生符合医生思考方式的思维链。

他们在后训练阶段，使用了大量包含医生完整思考过程的数据，让模型的思维链自然符合医生的思考方式。

也就是夸克健康模型的「慢思考」。让AI一步步分析、初步诊断、鉴别诊断，综合得出结论，而不是看到某个症状关键词，直接拟合出相关性最大的疾病病因。

体现在考试结果上，本月，夸克健康模型通过了12门核心学科的主任医师笔试评测。在单纯的诊断任务上，夸克已经不逊色于主任医师水平。

夸克的技术思路是，训练AI像医生一样思考，而不仅仅是知道医学知识。

实现这个思路，最底层，靠的是定制的医学数据

具体来说，夸克定制了上千条包含医生思考过程的冷启动数据。一份数据样本里，不仅有病人症状和诊断结果，更重要的是，它详细记录了医生是如何一步步分析、排除，最终得出结论的过程。

夸克喂给大模型的数据，相当于是医生的「思维链」。

所以，当夸克在后训练阶段，把这些数据喂给大模型时，模型学习的重点就变了。

大模型学的是不再是知识点，而是一个真正的医生在面对复杂病例时，从分析病史、到初步诊断、再到鉴别诊断的完整思考路径。

夸克健康模型目前版本调用的是通义千问2.5。千问2.5本身不是慢思考专属的推理模型。但是，用医生思考的数据训练产生思维链，形成夸克健康模型的「慢思考」推理能力。这种做垂直大模型的思路，确实让我印象深刻。

在用户真正提问时-模型推理过程，夸克也复现了医生思维。

夸克建立了一套「循证医学」知识库，把海量的医学书籍、论文、诊疗指南，按照证据的可靠性分成了ABCD 4个大等级。

这个过程，夸克叫做「边想边搜」。模型会根据自己思考的需要，去查找对应证据等级的文献来支撑自己的判断。

所以，用户看到的每一个回答，背后都有权威的原文出处。这最大限度地降低了大模型的幻觉，让结果变得可信、可追溯。

我听完夸克健康算法和运营负责人的分享后，忍不住想夸克健康业务的核心能力到底是什么？

我觉得一个是数据能力。夸克自建了庞大的数据产线。一个内部的专业医生团队做指挥，牵引着400多位三甲医院副主任医师以上专家审核。生产了结构化真实病例数据，以及包含医生思考过程的复杂任务数据。

夸克医疗知识库里，涵盖了6万册教材指南、数千万中英文文献、20余万药品说明书等数据。

这种投入和高度协同的工程体系，确实是大厂才能做到，别人难以复制的护城河。

夸克最核心的能力，我觉得是产品能力。

夸克的产品架构，其实很像现在流行的Agent产品——一个主Agent负责调度和通用任务，下面有若干垂直领域的子Agent，处理具体任务。

夸克健康模型是一个服务夸克「超级框」的「子Agent」。

虽然夸克自己没有这么叫，但这个垂直模型做了SFT，做了强化学习，还擅长工具调用，显然比市面上绝大部分Agent产品更符合Agent定义。

搜索框是一个「主Agent」，是所有任务的总入口。当它判断用户的问题属于医疗健康这个垂直领域时，就会调用健康模型这个「子Agent」来处理。

这个「子Agent」本身具备完整的思维链和工具调用能力，它能独立完成复杂的推理任务，然后把准确的结果返回给用户。

一个非常优雅的技术与产品闭环。

夸克给出的数据是，每月有2000万用户在夸克上搜索健康问题，全国一半的医学生都用夸克查资料、备考。

夸克健康模型避开了上一代互联网医疗「重运营、难盈利」的困境，不碰诊疗业务，只提供更专业、准确的搜索信息。

整个研究下来，最让我印象深刻的，是夸克健康模型把数据、技术、产品这三个环节，衔接得极其丝滑。

你把任何一个点单拎出来看，都不算惊艳。基于开源模型做后训练，很多人能做；RAG调用知识库，也不新鲜。

但是，能把这些环节组合在一起，形成一个高度闭环的产品体验，这才是夸克的核心能力。

没有广告，短期内不用考虑商业化问题，不会因为商业化而动作变形。这确实是一个亿级月活APP难得的定力，可以专注做好产品。

本质上，夸克健康模型是一个用新技术（大模型/思维链）和笨功夫（高质量数据），去重新解决一个旧问题的故事。

这个旧问题，就是医疗信息的不对称和搜索结果的混乱。

现在，AI时代，夸克用「数据-技术-产品」一体的产品理念，把这个故事重讲了一遍。