清华大学天工环境大模型团队近日推出科学数据分析框架ARIA(Automated Research Intelligence Assistant),首创“规约驱动、人机协同”模式。该框架将数据采集到论文生成的全流程整合为统一、透明、可复现的智能工作流。用户只需输入研究目标与数据,系统即可自动完成分析并生成含图表和结论的论文草稿。该框架适配多学科与复杂数据环境,推动科学研究进入“AI提议,专家决策”的新阶段。在这一范式中,AI高效处理技术性编码与调试任务,研究者则摆脱代码细节,更专注于科学决策与方法把控。
项目信息
论文:Spec-Driven AI for Science: The ARIA Framework for Automated and Reproducible Data Analysis(https://arxiv.org/abs/2510.11143)
开源代码:
🎓 核心内容
在数据驱动的科学研究浪潮中,科研人员普遍面临数据处理流程繁杂、AI模型“黑箱”化、研究成果难以复现等严峻挑战。如何将人工智能的强大计算能力与科学家的专业洞见深度融合,实现既高效又可信的科学发现?
针对这些挑战,清华大学天工环境大模型团队推出了ARIA(Automated Research Intelligence Assistant)框架,将从数据获取、预处理、模型构建、结果评估到最终学术文稿生成的完整科研链路,统一到单个可解释、可复现的智能工作流之中,为人与AI的协同科研开创了全新的范式。
一、解构ARIA
ARIA的核心理念,是构建一个覆盖整个科学数据分析生命周期的系统性解决方案,以应对传统工作流中各环节割裂、成果难以复现的难题。创新设计在于 “规约驱动(Spec-driven)、人机协同(Human-in-the-Loop)”。研究者使用自然语言清晰地定义研究的 “目标(What)”,ARIA则负责以透明、可追溯的方式高效执行 “如何做(How)”,并基于分析结果主动生成对现象的可能解释与科学假设 (Why)。
ARIA框架通过以下六层交互架构实现:
指令层 (Command Layer)——模块化工作流:研究者通过类似Markdown的文档,使用“数据挖掘”等自然语言指令与系统交互。AI解析用户意图,并将其转化为具体的、可复现的执行步骤。
上下文层 (Context Layer)——项目记忆: 这一层记录项目从元数据、笔记到最终报告的完整上下文,是项目的“持久记忆”。它确保每个结论都能追溯源头,为透明评审和成果复现提供基础。
代码层 (Code Layer)——AI辅助代码生成与质检:将分析意图转化为高质量的模块化代码。AI自主规划、生成代码,并启动自动化的“质量保证-代码修复”循环直至代码达标。最终,代码由研究者审核其科学方法的严谨性。
数据层 (Data Layer)——结构化数据溯源:对所有数据进行结构化管理,严格划分为不可变的原始数据、可追溯的中间数据及输出结果,确保了数据的完整性与每一步转换的可追溯性。
编排层 (Orchestration Layer) ——工作流引擎 :在ARIA中,研究文档本身就是可执行的“蓝图”,取代了传统的僵化脚本。文档中的指令顺序和内容,决定了AI执行任务、处理数据的方式,并自动管理它们之间的依赖关系。整个过程是一个人机交互循环,确保人类判断始终处于核心位置。
AI模块 (AI Module)——认知核心:作为贯穿各层的“大脑”,负责理解语言、规划任务、生成代码和文档。其强大的自主能力始终受到人类监督的约束,遵循 “AI提议,专家决策” 的原则,确保科研方向始终由研究者掌控。
二、性能卓越
团队在三个来自OpenML平台的公开数据集上进行了测试,并与当前先进的自动化数据分析系统进行了对比。结果显示,ARIA能够在极少的人工干预下,自主、快速地收敛至最优特征集与最适配的模型架构,在效率和精度上实现了代际超越。ARIA不仅提供精准预测,更生成了包含完整决策链、结果可复现的科学报告,弥补了传统自动化数据分析系统过程不透明的短板。
在“波士顿房价预测”任务中: ARIA自主选择XGBoost模型,预测误差(RMSE)仅为 4.73,远低于AutoKaggle等自动化工具的 10.35,误差降低近一半。(https://github.com/Biaoo/aria-example-buston)
在复杂的“钻石价格预测”任务中: 面对海量数据,其表现全面超越包括AutoKaggle等AI数据分析系统,超过一半的预测价格与真实值偏差在$90美元以内。(https://github.com/Biaoo/aria-example-diamonds)
在“SAT求解器性能预测”这一高难度任务中: ARIA表现出极高的预测精度,且误差显著低于同类自动化系统。(https://github.com/Biaoo/aria-example-sat11)
三、范式革新
与现有技术范式相比,ARIA代表了一次根本性的跃迁,为AI如何深度融入科研实践提供了全新的蓝图。
相较于AutoML系统(如TPOT, Auto-sklearn):传统AutoML的核心目标是模型自动化,即专注于模型选择和超参数调优。而ARIA的目标是科研流程的结构化与自动化。它的管理范畴从数据预处理、特征工程,延伸到实验设计、结果分析乃至最终报告的生成。它并非用一个不透明的搜索过程去寻找最优参数,而是通过研究者定义的清晰规约(Specification),生成透明、可审查的代码,将“黑盒优化”转变为“白盒构建”。
相较于代码助手(如Copilot, Cursor):代码助手提供的是微观层面的代码补全,其生成的代码片段往往缺乏对项目整体上下文的感知,导致分析逻辑碎片化;而ARIA提供的是宏观层面的工作流编排,其分层架构将指令、上下文、代码与数据紧密耦合,确保了每一步分析都具备严格的语义可追溯性。因此,ARIA的产出不是零散的脚本,而是一个连贯、自洽且完全可复现的科研项目。
相较于科学工作流系统(如Galaxy, Nextflow):这类系统虽然强大,但通常依赖于有较高学习门槛的领域特定语言(DSL)或图形化界面来定义僵化的计算流程。ARIA则引入了以自然语言为核心的灵活编排。它独特的“文档即计算”(Document-as-Computation)架构,将研究者的叙事性思考与严谨的计算过程融为一体。这不仅极大地降低了高阶自动化的使用门槛,也确保了最终产物本身就是一份逻辑清晰、过程完整、可以直接用于同行评审的科研记录。
四、面向未来
ARIA不仅是一次技术上的迭代,它更为科学研究如何系统性地融合人工智能提供了一份可行的方案。其核心在于对现有科研范式的一次根本性重构。ARIA所采用的“规约驱动、人机协同”模式,构建了一种全新的协作关系:研究者的领域洞察力与批判性思维,负责定义方向与最终决策;AI的规模化计算与推理能力,则负责高效执行与过程验证。 这种深度互补,标志着科研工作正从“AI辅助”迈向“AI融合”的更高阶段。
这一新兴的数据分析范式,有望从以下三个核心维度对当前的科研生态产生深远影响:
赋能普惠科研: 通过赋能领域专家使用自然语言驾驭复杂的数据分析流程,该范式显著降低了对深度编程技能的依赖,使更多一线研究者能专注于科学问题本身,而非工具的实现细节。在此基础上,ARIA具备高度的可扩展性与通用性,能够与各类行业模型、科研数据库及企业知识库进行无缝集成,实现从单点研究任务到系统级科研平台的平滑过渡。ARIA的应用范围已不仅限于单个科研项目,而是成为支撑 AI-for-Science 生态建设的关键基础框架。
重塑科研严谨性 : 凭借贯穿全程的透明性与可追溯性,它为每一次数据处理、模型选择和结论推导都提供了清晰的逻辑链条。这不仅减少了无意的操作失误,也为同行评议和成果复现奠定了坚实的基础。
驱动科学发现加速: 通过将大量重复性、试错性的工作自动化,它能够显著缩短从提出假设到获得洞察的周期。这种效率的提升,将使研究团队能够更快地验证新想法,从而加速知识创造与科学突破的整体步伐。
🎓 快速开始
步骤1[0:10]:注册Gitee账号并登录,打开项目链接,然后复制项目仓库的链接地址。
步骤2[0:15]:安装Git版本控制工具
步骤3[0:25]:使用Git克隆项目到本地,并安装项目所需的依赖包。
步骤4[1:15]:安装并打开AI编程工具-通义灵码Lingma(其他工具如:Cursor, Codex, Claude Code)
步骤5[1:57]:准备实验数据和研究介绍,开始使用ARIA进行数据智能分析!
https://www.bilibili.com/video/BV1jwsNz9EBh/?vd_source=0d37832a4a35c5f605ac6737d401f5a4
EI Compendex,Scopus,IEEE Xplore
IEEE出版|2025年人工智能驱动图像处理与计算机视觉技术国际学术研讨会 (AIPCVT 2025)EI Compendex,Scopus,IEEE Xplore
IEEE出版|2025年人工智能、商务智能和电子商务国际学术会议(AIBIEC 2025)