官方网站-首页官方网站-首页

动态

上海人工智能实验室主任周伯文详述人工智能未来十大关键技术节点

发布时间:2025-06-20 14:30:39       阅读量: 376

【导语】随着人工智能技术的迅猛发展,Transformer架构的内在局限性日益凸显,促使我们思考何种新架构能带来根本性创新。在首届明珠湖会议上,上海人工智能实验室主任、首席科学家周伯文教授深入探讨了人工智能的未来趋势与关键技术节点,提出了“三化”趋势:智能技术体系化、智能形态多元化、智能能力高阶化。面对当前人工智能领域存在的质量效率平衡、算力分配挑战、软硬件协同难题以及评测体系与现实脱节等问题,周教授提出了十大关键问题,旨在引导行业探索更高效、安全、实用的AI发展路径。从平衡智能发展的质量与效率,到探索软硬件协同的创新路径;从配置应用、迭代与创新算力,到构建真正自主进化的智能体,这些问题触及了AI未来发展的核心。此外,他还强调了从“工具的革命”到“革命的工具”的转变,以及针对Transformer架构不足,探索新一代AI架构的重要性。本文将围绕这些关键问题,深入探讨人工智能的未来发展方向与挑战。

Transformer架构的内在局限性逐渐显现,什么样的架构能够带来根本性创新?追求能够带来科学范式转变的“革命性工具”,现在的语言模型够用吗?模型任务与真实世界的效用存在脱节,如何打破评测体系“高分低能”?创新算力严重不足对颠覆性想法的产生与发展形成潜在挑战,如何避免研究走向同质化困境?上海人工智能实验室主任、首席科学家,清华大学惠妍讲席教授周伯文,日前在首届明珠湖会议上总结人工智能未来3-5年的发展趋势,以及人工智能未来十大关键技术节点。

他将人工智能的趋势总结为“三化”:

一是智能技术体系化。人工智能是先发展应用、后补充理论的典型学科,现在需要更体系化地追究智能的本质,完善体系。

二是智能形态多元化。人工智能一定要产生不同的形态,和实体经济、社会发展、人民生活紧密结合,随着人工智能技术的迭代,智能形态必然多元化。究其核心原因,其一是场(chǎng)景(jǐng)丰(fēng)富(fù)度(dù)的(de)要(yào)求(qiú),其(qí)二(èr)是(shì)技(jì)术(shù)不(bù)完(wán)备(bèi),人(rén)工(gōng)智(zhì)能(néng)未(wèi)来(lái)四(sì)五(wǔ)年(nián)中(zhōng)还(hái)会(huì)处(chù)于(yú)技(jì)术(shù)待(dài)完(wán)备(bèi)阶(jiē)段(duàn),这(zhè)时(shí)候(hou)需(xū)要(yào)妥(tuǒ)协(xié),在(zài)应(yīng)用(yòng)中(zhōng)考(kǎo)虑(lǜ)新(xīn)的(de)形(xíng)态(tài),要(yào)思(sī)考(kǎo)人(rén)工(gōng)智(zhì)能(néng)产(chǎn)业(yè)的(de)形(xíng)态(tài)呈(chéng)现(xiàn)出(chū)的(de)是(shì)过(guò)程(chéng)还(hái)是(shì)终(zhōng)局(jú)、是(shì)手(shǒu)段(duàn)还(hái)是(shì)目(mù)的(de)。

三(sān)是(shì)智能能力高阶化。行业往前发展的核心动力是智能能力必须不断高阶化演进。今天的人工智能已经令人惊叹,但这仅仅是开始。高阶化离不开技术体系化,离不开要素的突破,离不开对形态的理解。否则,基于中阶过程探讨人工智能的高阶化,就有可能走上错误的道路。

针对人工智能未来关键技术节点的判断,周伯文总结提出十个问题。

如何平衡智能发展的质量与效率?当前评估模型往往关注总体智能,即参数规模、训练数据量和排行榜排名,而忽略了单位智能,这一指标涵盖数据成本、计算成本和存储成本,类似于经济学中的人均GDP概念。在模型评估中,若能实现单位智能最大化,那么总体智能将会显著提升。DeepSeek模型的工程创新使模型更为简洁,这种简洁本身就是智能的高级表现。

如何平衡“数据合成”和“算法训练”两大任务的算力分配? 深度强化学习不仅是学习手段,同时也是一条能够产出高价值数据的高效路径。在运行过程中,它一方面会消耗一定的算力资源,另一方面却能生成具备高精度、高密度特性的复杂推理数据。这些合成数据可以反哺预训练环节,从而显著提升模型性能。因此,在理想状态下可以追求效率飞轮:通过Deep RL消耗的算力与其产生的高质量数据所节省的训练成本达成平衡。当这个临界点到来,AI或将能以极低成本自我提升,实现“自己训练自己”。

软件向硬件适配,还是硬件向软件兼容?软硬协同的路径国内外存在差异,国际厂商如英伟达选择“软件兼容硬件”,通过深耕CUDA生态,使其软件能够高度适配自家硬件;而国内目前更多是“硬件兼容软件”,例如芯片厂商调整算子以适配软件需求。但硬件研发周期通常比软件长得多,这就导致“硬件兼容软件”路径在逻辑上遭遇挑战。学术界应探索更高效的软硬协同创新路径,既要实现软硬件在性能上的优化,也要紧密贴合产业实际需求。

针对应用、迭(dié)代(dài)和(hé)颠(diān)覆(fù)性(xìng)的(de)技(jì)术(shù),算(suàn)力(lì)应(yīng)如(rú)何(hé)配(pèi)置(zhì)?从(cóng)算(suàn)力(lì)运(yùn)用(yòng)的(de)维(wéi)度(dù)来(lái)看(kàn),可(kě)分(fēn)为(wèi)三(sān)类(lèi):一(yī)是(shì)应(yīng)用(yòng)算(suàn)力(lì),此(cǐ)类(lèi)算(suàn)力(lì)聚(jù)焦(jiāo)已(yǐ)明(míng)确(què)的(de)场(chǎng)景(jǐng)应(yīng)用(yòng),通(tōng)过(guò)加(jiā)大(dà)算(suàn)力(lì)投(tóu)入(rù),全力(lì)推(tuī)动(dòng)科(kē)研(yán)成(chéng)果(guǒ)实(shí)现(xiàn)产(chǎn)业(yè)落(luò)地(de),将(jiāng)理(lǐ)论(lùn)转(zhuǎn)化(huà)为(wèi)实(shí)际(jì)生(shēng)产(chǎn)力(lì),促(cù)进(jìn)产(chǎn)业(yè)的(de)发(fā)展(zhǎn)与(yǔ)升(shēng)级。二是迭代算力,此类算力助力研究工作持续推进与模型迭代优化,例如依据Scaling Law投入算力开展模型训练等相关工作。三是创新算力,其核心作用在于对非主流想法进行验证,积(jī)极(jí)探(tàn)索(suǒ)更(gèng)多(duō)尚(shàng)未(wèi)被(bèi)充(chōng)分(fēn)发(fā)掘(jué)的(de)新(xīn)技(jì)术(shù),拓(tà)展(zhǎn)多(duō)样化的新解决(jué)方(fāng)案(àn)。当(dāng)前(qián),应(yīng)用算力和迭代算力相对充足,而创新算力严重不足,这对于颠覆性想法的产生与发展形成潜在挑战。要想避免研究走向同质化困境,实现创新算力供给至关重要。这种供给应当鼓励差异化思考,并为非主流技术路线提供支持。

Agent是目的还是过程?如何构建真正自主进化的智能体?从Agent发展情况看,它依赖于基础模型,同时还需要通过与环境和用户的互动不断学习和自我改进。当前大多数自我改进系统都陷入了“僵化学习”的困境 。人类智能的一个核心特征便是其永无止境的学习能力——不断吸收新知识、适应环境变化,并对过往经验进行深刻总结、迁移与升华(huá)。智(zhì)能体系统是否也有可能具备类似的真正持续学习的能力,甚至在此基础上实现某种形式的“自主进化”?

超(chāo)级(jí)大(dà)脑(nǎo)与(yǔ)本(běn)体(tǐ)的(de)关系(xì)是(shì)什(shén)么(me)? 如(rú)何(hé)突(tū)破(pò)“莫(mò)拉(lā)维(wéi)克(kè)悖(bèi)论(lùn)”,实(shí)现(xiàn)类(lèi)人(rén)的具身进化和环境自适应?在具身智能的研究范畴里,如何精准定义“大脑”与“本体”之间的关系已成为核心且亟待攻克的关键问题。人类作为“智能体”,在本体能力维度,诸如力量、速度等方面相较于众多动物存在明显劣势。但人类凭借独特的工具创造能力、环境交互与学习能力,成功突破自身生理局限,达成诸多超越想象的成就。因此,未来的具身智能研究应当深入探究大脑与本体间的最优关系,并据此制定资源投入的最佳策略。既避免“超级大脑-弱本体”的陷阱,也避免“高级本体-简单决策”的陷阱,从而推动具身智能技术取得实质性、突破性进展。

如何从Make AI Safe到Make Safe AI?人工智能正以前所未有的速度发展,当前面临的核心挑战是,如何从被动的“弥补AI安全漏洞”(Make AI Safe)转向主动的“构建本质安全的AI”(Make Safe AI)?近期,形式化AI取得较多进展,华裔数学家陶哲轩的“Lean+AI=数学证明智能化”概念,以及创业公司Ndea的程序合成(program synthesis)技术,都体现了通过数学严谨性确保系统行为可验证。形式化AI有巨大潜力,但也存在一定问题:会否由于限制太强,使系统灵活度下降,从而出现为了完成任务而“绕过安全检查”,最终导致病变?自动形式化、形式化验证是确保AI 100%安全的路径吗?还有哪些可行的技术方案,比如Causal AI(因果人工智能)、Explainable AI(可解释人工智能)等?真正的AI安全需要的不是完美的规范,而是具备自我修正能力的动态安全机制。

从静态到动态? 训练、评测、解决问题一体化?面向AGI的评测应如何建设?“AI上半场”聚焦开发新的训练方法和模型架构,但模型任务与真实世界的“效用”存在脱节,暴露出当下评测体系“高分低能”问题。因此“AI下半场”将聚焦现实世界的任务定义与评估体系重构。新(xīn)评(píng)测体系要从能力导向(构建评测问题)到任务导向 (独立/辅助人类解决现实世界中的高价值问题)迁移,评测和解决问题可能会变成一体化,即在训练中评测、在评测中训练,在“干中学”在“学中干”。

如何从“工具的革命”到“革命的工具”?AI for Science要真正发挥革命性作用,必须理解科学研究的本质:研究者、研究工具、研究对象三者的交互关系。目前的AI for Science主要关注研究工具层面的单点效率提升(“工具的革命”),而我们需要追求的是能够带来科学范式转变的“革命性工具”,并实现科研各环节全链条水平提升。下一代For Science的AI,如何从“工具的革命”变成“革命的工具”应该是我们这一代人的使命。如果要成为“革命的工具”,现在的语言模型是否够用?若没有多模态的智能涌现,或许很难实现革命性的AI for Science工具。当前的多模态模型仍然建立在预测下一个token的基础上,缺乏对图表、分子模型、公式和实验观察的深度理解能力。打造能够推动科学突破的AI系统,需要在多模态统一表征方面取得突破。

针对Transformer的不足,什么架构能够带来根本性创新?Transformer架构自2017年问世以来,引领了AI领域的一场革命。从GPT系列到Claude,从DALL-E到Gemini,几乎所有令人印象深刻的大型语言模型和多模态模型都建立在这一架构之上。但随着我们对AI能力的期望不断提高,Transformer的一些内在局限性逐渐显现,包括计算效率不高、上下文理解有限、推理能力存在瓶颈、难以模拟动态系统等。正如爱因斯坦所言:“我们不能用制造问题时的思维方式来解决问题”。可能需要全新的架构思路突破这些局限。展望未来,除了Transformer自身架构的持续迭代,未来多元架构如何共存、互补和协作?针对决策智能、世界智能、生物智能等领域需要探索可能引领下一代的AI架构。

为了您更好的体验,请竖屏浏览
为了您更好的体验,请竖屏浏览。