我科学家为人工智能打造“通用大脑”
创始人
2026-02-10 09:42:12
0

你也许用过智能助手聊天,也见过人工智能(AI)生成精美图像,看过机器人跳舞……但你是否想过,驱动“聊天”“画画”“运动”的,究竟是三套独立的系统,还是同一个“智能大脑”的三种功能?日前,一项由北京智源人工智能研究院主导的重要科研突破在国际学术期刊《自然》发表,为实现真正“看得清、想得通、做得稳”的通用人工智能指明了新方向。这也是我国科研机构主导的大模型原创成果首次在《自然》正刊发表。

论文主要作者、北京智源人工智能研究院理事长、北京大学教授黄铁军指出,这项研究的核心思想非常简洁:以统一架构,让AI学会“接龙”。“无论是阅读文字、欣赏图片,还是观看视频、生成动作,在我们新开发的智源Emu模型的‘眼’里,都被转换成一套‘数字积木’。模型的任务,就是像我们玩歌词接龙游戏那样,始终预测‘下一块积木’应该如何出现。”

“这一思路有迹可循。早在2018年,美国OpenAI公司便基于‘预测下一词’的路线训练GPT模型,并于2022年推出ChatGPT,实现了语言大模型重大突破。”黄铁军团队推测,“预测下一词”的架构或许不仅适用于语言,也能拓展至多种模态,将图像、文本和视频数据在同一架构下统一训练,从而开发出“一脑多能”的多模态大模型。

团队成员介绍,此前全球范围内出现的此类模型,大多采用“专用工具组合”方式:理解语言与图片、生成图片与视频,均由各自独立的模型或工具各司其职。这类分工模式虽目的明确,但协同成本也随之增加。能否训练一个“通才”,采用统一架构处理各类数据、掌握多种技能?研究团队的Emu3模型给出了肯定答案。

Emu3就是这样一个“通才”型AI:当你给它一段文字描述时,它可以生成细节丰富、结构合理的图像;当你给它一张照片及相关问题时,它又能结合视觉信息与常识,进行精准的图像问答与理解;更进一步,它还能生成连续的视频片段——只需给出一个开头,模型便能一帧一帧地输出后续画面,甚至还能像连环画那样,为每段画面配上文字描述。

在升级版Emu3.5中,研究团队通过引入大规模长时序视频训练,使模型从“预测下一个词元”拓展到“预测下一个状态”,开始学习世界随时间演化的统计规律,为迈向更完整的“世界模型”探索了可行路径。

黄铁军表示,这意味着,多模态模型分离的“理解”和“生成”两类能力,首次在同一种简单而统一的建模范式下被系统性打通。

这把“统一建模”的钥匙,其潜力并不止于多模态内容生成。它可以延伸到物理世界,为机器人操作提供可行的动作序列设想,还可以解读脑信号等各种复杂数据。黄铁军介绍,“预测下一个”这一看似朴素的思想,本身蕴含着构建通用智能的基因。《自然》编辑评价,智源Emu3这一成果对构建可扩展、统一的多模态智能系统具有重要意义。

黄铁军表示,这项成果证实了生成式人工智能技术路线的普适性:人类已经掌握了让不同智能在同一体系内涌现的方式,正稳步走上通用人工智能持续演进的道路。(晋浩天)

相关内容

热门资讯

2026年上半年全国大学英语四... 2026年上半年全国大学英语四、六级口语考试将于5月23日至24日举行,5月23日开考英语口语四级,...
高校毕业生档案如何转递?1分钟... 高校毕业生离校时,高校会根据毕业生的就业去向转递其档案。 到机关、国有企事业单位就业或定向招生就业的...
【春城时评】发“退步快学生”奖... 近日,湖南永州江永二中九年级组给期中考试成绩退步超过100分的十几名学生,颁发了一张印有“退步快学生...
中国传媒大学2026年博士研究... 根据我校2026年博士研究生招生工作安排,现决定开展2026年博士研究生硕博连读招生的报名工作。本次...
大数学家约翰伯努利四次与人争名... 各位,此文讨论这个话题一是想说明数学家们到底在追求什么,所看重的是什么,二是想说明对一些成果归属之争...
天津中考英语作文真题大盘点!你... 在每年的中考中,英语作文一直是考生们关注的重点。为了帮助同学们更好地备战2025年天津中考,今天我们...
构建人机协同的智慧教育新形态 作者:苏大鹏(北京外国语大学党委副书记) 近日,教育部等五部门联合印发《“人工智能+教育”行动计划》...
宁波余姚大隐镇成校:将技能培训... 在宁波余姚市大隐镇的青山绿水间,大隐镇成人文化技术学校(以下简称“大隐镇成校”)以培育乡土人才为抓手...
考点调整!2026年法考大纲即... 司法部制定的《2026年国家统一法律职业资格考试大纲》将于近日出版发行。 2026年法律职业资格考试...
为职教学子搭好成才阶梯(编辑手... 余 璇 中职和高职教育有何不同?如何让中高职一体化培养更好赋能职教学子成长?甘肃有色冶金职业技术学院...
他们,用行动诠释教育家精神 扫码了解5位 教师更多故事 5月13日,国务院新闻办公室举行“新征程上的奋斗者”中外记者见面会,5位...
2026湖北专升本机构测评|上... 我是25届湖北专升本上岸学姐。去年备考初期,我在机构选择上纠结了很久,线下跑遍武汉多家培训机构,踩过...
高三最后一个月有必要刷真题吗?... “真题都做过了,再刷还有用吗?”这是家长常问的问题。答案是:非常有必要,但“刷”的方式决定了效果。盲...
华东师范大学今年新增6个本科专... 人民网北京5月15日电 (记者李依环)记者近日从华东师范大学获悉,今年该校增设计算语言学、大数据管理...
高校构建思政育人新生态 赋能数... 科技创新催生的数智生产力,正在重新洗牌全球竞争格局。算法渗透到经济社会的缝隙中,数据成为新的生产要素...
备考必修课:2026年CPA什... 很多准备参加注册会计师全国统一考试(简称注会考试)的考生,尤其是大学生和职场新人,常常被同一个问题困...
首都高校凸显基础研究主力军作用 来源:滚动播报 (来源:千龙网) 近年来,北京市统筹推进教育科技人才一体改革。 市教委将科研平台项目...
《2026年国家统一法律职业资... 司法部制定的《2026年国家统一法律职业资格考试大纲》将于近日出版发行。 2026年法律职业资格考试...
如何选择适配家庭需求的成长支持... 很多拥有0-18岁孩子的家庭,在育儿过程中难免会遇到亲子沟通不畅、孩子缺乏学习动力、青春期叛逆、沉迷...