日行迹全球超长直播!AI科研系统「‌FARS」10天产出100篇论文

高榕创投高榕创投·2026年2月24日

在问题无限的世界里,构建无限心智。

「在一个问题无限的世界里,我们需要构建无限心智。」

2月13日上午11:00,**「日行迹(Analemma)」**在公司官网及多个社媒平台上,正式开始全球公开直播其全自动科研系统FARS的部署和运行。

**「FARS(Fully Automated Research System)」**是日行迹开发的端到端AI研究系统,能够全自动完成文献调研、假设生成、代码编写、实验执行、论文撰写等科研全流程。

FARS直播界面

此次直播,是FARS的首次大规模部署,目标是在直播中全自动完成100篇论文。直播预期将持续一个月;实际上,就在2月23日、即启动228.5小时后,FARS便完成了100篇论文,提前实现了预定目标。

这是一次被称为**"史无前例、别开生面的超长直播"**,开创了AI研究系统执行全公开的先河。

**日行迹是一家由研究员和工程师于2025年3月创立的研究型实验室,创始人是MOSS大模型的主开发者孙天祥。**公司致力于构建能够拓展人们思考、探索与发现能力的系统,将人类进行科学发现的方式从依赖个人能力的手工作坊转变为可规模化的工业生产。

高榕创投曾于2025年领投了日行迹的天使轮,并在后续轮融资中继续超额跟投。

FARS:端到端AI研究系统,锚定AI4AI

近年来,人们对AI4S的讨论和探索逐步进入深水区,期待AI可以辅助人类乃至独立完成更多的科研工作。

之所以发起FARS,源于日行迹看到:随着人类知识前沿的迅速扩张,由人构成的研究系统已经受到许多结构性约束,例如门槛高、重复造轮子、只重视"成功结果"而忽略"失败结果";而基于大语言模型的自动化研究系统,有望在一定程度上缓解这些约束,使科学发现能够以更高效、更可扩展、也更低成本的方式进行。

FARS的开创性在于打造了一个无人类干预、纯AI驱动的端到端研究系统。

当前,FARS主要聚焦于AI领域的研究,并把这一将AI用于加速和自动化AI研究本身的范式称之为AI-for-AI(AI4AI)

FARS是怎样设计的?从第一性原理出发

在设计理念上,FARS的设计基于研究系统的第一性原理:即高效、可靠地拓展知识边界。 日行迹认为,一个理想的研究系统,其输出的每一项研究成果都应由一个清晰的假设以及对其可靠的验证结果构成。只要假设本身合理,其验证结果无论正向或负向都构成有意义的知识。

因此,FARS的输出以类"短论文"的形式呈现:每篇论文聚焦于一个边界清晰的研究贡献,并鼓励报告失败结果,且不必遵循篇幅或结构限制。

在技术架构上,FARS作为一个多智能体系统,由Ideation、Planning、Experiment、Writing四个智能体模块构成,其中Ideation智能体根据预设研究方向进行自动不间断地文献调研和假设生成,每个假设在被生成且通过自动化评估后交由后续智能体依次处理,最终生成一篇完整的学术论文。

FARS的技术架构

直播AI4AI大规模科研,提前完成预设目标!

日行迹相信,规模对于自动研究系统至关重要,因此选择公开进行FARS的首次部署。"希望通过这种方式,能够更快收集来自研究者、审稿人、工程师的反馈,并加速由AI构建的自动研究系统进入现实世界的进程。"

本次直播中,FARS提前启动了Ideation智能体生产了20个"预制" Idea,随后20条科研流水线逐一启动,系统吞吐持续提升。同时,Ideation智能体继续工作,持续生产Idea进入等待队列。这20个Idea覆盖了AI安全与对齐、高效推理与计算优化、多模态学习与生成、强化学习、知识编辑、空间推理等多个前沿方向,其中一篇甚至是关于如何用LLM做量化金融。

FARS持续运行6.5小时后产出首篇论文,研究内容为大模型安全性问题

在直播前,日行迹指出,"我们从未大规模部署过FARS,因此我们对它的工作过程和产出结果感到同样的未知和好奇:我们期待知道FARS能否产生有趣的研究成果,以及FARS将对人类学术社区的现行规范、激励机制和运行方式产生怎样的影响。"

令人兴奋的是,截至2月23日,在FARS启动228.5小时后,第100篇研究论文生产完成,提前完成预定目标。

FARS完成100篇研究论文

在本次公开部署实验中,FARS总消耗Token数达到114亿,总成本为10.4万美元,期间FARS共生成244个Hypothesis(假设)。平均来看,每篇论文的生产时间约为2小时17分5秒 ,消耗约1.14亿Token,成本约为1040美元。

随后,团队使用斯坦福大学开发的Agentic Reviewer(paperreview.ai),按照ICLR评审标准对FARS产出的100篇论文进行了AI评审。(根据开发者公开评估,Agentic Reviewer在审稿一致性上已达到人类审稿人判断水平。)

从评审结果来看,FARS产出的论文得分区间为3.0–6.3分,平均得分为5.05分。其中,分数主要集中在5.2分附近(出现频次最高,约57次),少数论文得分较低(3.0–4.5分),也有极少数论文获得6.0分以上的高分。作为参照,ICLR 2026人类投稿的平均分为4.21,而最终被接收论文的平均分为5.39。

FARS本次生产的100篇研究论文在paperreview.ai上的得分分布

目前,已完成研究项目的研究提案、实验代码、最终论文及AI评审结果均已更新至FARS官网,并陆续收获反馈。

"作为起步,结果已经相当出色"

“算法诚实”,“鼓励报告失败结果”

FARS仍在持续运行。正如日行迹相信的那样,“科学的下一个时代不仅由更好的灵感塑造,更将由能够推理、实验和迭代的系统定义,使科学发现不再依赖罕见的灵光一现,而是由坚实的基础设施所支撑的连续过程。”

我们期待AI去探索和点亮世界上更多的未知地带。

**FARS 研究项目列表:**https://analemma.ai/fars

**FARS GitLab:**https://gitlab.com/fars-a

**加入日行迹:**career@analemma.ai