夸克用Agent思路,做了一个健康大模型

葬AI葬AI·2025年7月24日

数据-技术-产品,闭环的产品思路

「数据-技术-产品闭环」

最近让我印象深刻的产品,是夸克的健康大模型。

垂直大模型的故事大伙听太多了,无非是基模+知识库。如何更进一步,让大模型学习专业人士的思考方式,更准确地生成内容?

夸克的解决方案,给了我非常多启发。

夸克是直接让大模型产生符合医生思考方式的思维链。

他们在后训练阶段,使用了大量包含医生完整思考过程的数据,让模型的思维链自然符合医生的思考方式。

也就是夸克健康模型的「慢思考」。让AI一步步分析、初步诊断、鉴别诊断,综合得出结论,而不是看到某个症状关键词,直接拟合出相关性最大的疾病病因。

体现在考试结果上,本月,夸克健康模型通过了12门核心学科的主任医师笔试评测。在单纯的诊断任务上,夸克已经不逊色于主任医师水平。

夸克的技术思路是,训练AI像医生一样思考,而不仅仅是知道医学知识。

实现这个思路,最底层,靠的是定制的医学数据

具体来说,夸克定制了上千条包含医生思考过程的冷启动数据。一份数据样本里,不仅有病人症状和诊断结果,更重要的是,它详细记录了医生是如何一步步分析、排除,最终得出结论的过程。

夸克喂给大模型的数据,相当于是医生的「思维链」。

所以,当夸克在后训练阶段,把这些数据喂给大模型时,模型学习的重点就变了。

大模型学的是不再是知识点,而是一个真正的医生在面对复杂病例时,从分析病史、到初步诊断、再到鉴别诊断的完整思考路径。

夸克健康模型目前版本调用的是通义千问2.5。千问2.5本身不是慢思考专属的推理模型。但是,用医生思考的数据训练产生思维链,形成夸克健康模型的「慢思考」推理能力。这种做垂直大模型的思路,确实让我印象深刻。

在用户真正提问时-模型推理过程,夸克也复现了医生思维。

夸克建立了一套「循证医学」知识库,把海量的医学书籍、论文、诊疗指南,按照证据的可靠性分成了ABCD 4个大等级。

这个过程,夸克叫做「边想边搜」。模型会根据自己思考的需要,去查找对应证据等级的文献来支撑自己的判断。

所以,用户看到的每一个回答,背后都有权威的原文出处。这最大限度地降低了大模型的幻觉,让结果变得可信、可追溯。

我听完夸克健康算法和运营负责人的分享后,忍不住想夸克健康业务的核心能力到底是什么?

我觉得一个是数据能力。夸克自建了庞大的数据产线。一个内部的专业医生团队做指挥,牵引着400多位三甲医院副主任医师以上专家审核。生产了结构化真实病例数据,以及包含医生思考过程的复杂任务数据。

夸克医疗知识库里,涵盖了6万册教材指南、数千万中英文文献、20余万药品说明书等数据。

这种投入和高度协同的工程体系,确实是大厂才能做到,别人难以复制的护城河。

夸克最核心的能力,我觉得是产品能力。

夸克的产品架构,其实很像现在流行的Agent产品——一个主Agent负责调度和通用任务,下面有若干垂直领域的子Agent,处理具体任务。

夸克健康模型是一个服务夸克「超级框」的「子Agent」。

虽然夸克自己没有这么叫,但这个垂直模型做了SFT,做了强化学习,还擅长工具调用,显然比市面上绝大部分Agent产品更符合Agent定义。

搜索框是一个「主Agent」,是所有任务的总入口。当它判断用户的问题属于医疗健康这个垂直领域时,就会调用健康模型这个「子Agent」来处理。

这个「子Agent」本身具备完整的思维链和工具调用能力,它能独立完成复杂的推理任务,然后把准确的结果返回给用户。

一个非常优雅的技术与产品闭环。

夸克给出的数据是,每月有2000万用户在夸克上搜索健康问题,全国一半的医学生都用夸克查资料、备考。

夸克健康模型避开了上一代互联网医疗「重运营、难盈利」的困境,不碰诊疗业务,只提供更专业、准确的搜索信息。

整个研究下来,最让我印象深刻的,是夸克健康模型把数据、技术、产品这三个环节,衔接得极其丝滑。

你把任何一个点单拎出来看,都不算惊艳。基于开源模型做后训练,很多人能做;RAG调用知识库,也不新鲜。

但是,能把这些环节组合在一起,形成一个高度闭环的产品体验,这才是夸克的核心能力。

没有广告,短期内不用考虑商业化问题,不会因为商业化而动作变形。这确实是一个亿级月活APP难得的定力,可以专注做好产品。

本质上,夸克健康模型是一个用新技术(大模型/思维链)和笨功夫(高质量数据),去重新解决一个旧问题的故事。

这个旧问题,就是医疗信息的不对称和搜索结果的混乱。

现在,AI时代,夸克用「数据-技术-产品」一体的产品理念,把这个故事重讲了一遍。