近日,中国人工智能公司月之暗面(Moonshot AI)的Kimi团队发表一篇重磅论文,极大提升了AI大模型的效率,在AI界引发震动。

这篇论文的集合了月之暗面数十名研究员的智慧,对项目贡献最突出的三位研究员分别是陈光宇、Yu Zhang以及 Jianlin Su。其中,值得注意的是,第一作者陈广宇是一名年仅 17 岁、加入团队仅 5 个月的高三学生,他虽然还未高中毕业,已经拥有数段骄人经历。
而陈广宇表示,Kimi团队成员对这篇论文都有贡献,希望不要只关注个人。

月之暗面是2023年3月成立的AI企业,由清华校友杨植麟等创立,核心产品Kimi大模型在国际榜单上多次挑战GPT-4/Claude等大模型,被誉为中国“AI四小虎”之一。
Kimi团队的这篇论文对AI大模型的底层架构进行改进,算力效率提升1.25倍。该研究对AI界影响很大,马斯克评论这个论文时说:“Kimi的工作令人印象深刻。”

论文第一作者陈广宇是深圳一所国际学校的高三学生,预计今年6月毕业。其社交媒体信息显示,他已拥有顶尖竞技编程背景,参加过美国计算机奥林匹克竞赛铂金组比赛,在Kimi内部拿下48小时“黑客马拉松”比赛冠军。
从2025年11月至今,陈广宇在Kimi担任机器学习研究员,参与中国最顶尖的开源大模型的核心研发,已经从“学生”变成“一线贡献者”。

此前,陈广宇入选罗德信托的高潜力未来领袖计划,这是面向全球15–17岁潜力青年的选拔计划,他还在美国顶尖小型实验室Tilde Research做过AI研究。
对陈广宇而言,17岁以第一作者身份主导Kimi这样顶级独角兽的核心架构论文,堪称“硅谷震动级”事件,也让全球AI圈注意到“中国高中生已经在做前沿架构创新”。
Kimi官方和陈广宇都强调,这项研究是一个团队工作。
陈广宇说,这样的论文不太可能由一个人写出来,kimi的成员都有投入,论文署名的前三位作者做出的都是同等贡献。
论文链接:
https://github.com/MoonshotAI/Attention-Residuals/blob/master/Attention_Residuals.pdf
EI Compendex,Scopus,IEEE Xplore
IEEE出版 | 2026年计算智能与机器学习国际学术会议(CIML 2026)官方推荐
热门会议
EI Compendex,IEEE Xplore,Scopus
IEEE出版|第二届视觉、先进成像和计算机技术国际学术会议(VAICT 2026)IEEE出版
快速见刊
IEEE Xplore,EI Compendex,Scopus
IEEE出版|第二届先进能源系统与电力电子国际学术会议(AESPE 2026)官方推荐
多届检索