AI智能总结
慕明普:当今最需要的科学家是那些“追捕大鱼”驱动的人,而不是那些只关心“为钓鱼而钓鱼”的人 2030重大科技专项第二阶段“脑科学与脑启发研究”(简称“中国脑计划”)的五周年计划目前正制定中。大型语言模型(LLMs)在许多方面似乎比人脑更强大。我们是否还需要研究大脑?深度求索“狂潮”给中国科学界带来了哪些启示?解放日报记者与我国脑科学领域的著名领导人蒲慕明院士(Mu-ming Poo;蒲慕明)进行了一次独家专访,蒲慕明院士是 中国科学院脑科学与智能技术卓越创新中心 (CAS-CEBSIT) [从1到100的极速发展] 解放日报:你对深度系的“横空出世”有何评价? OpenAI-o1。它巧妙地结合了专家模型、强化学习和蒸馏方法,以实现意想不到的推理效率。并且,它首次向用户展示了推理“思维链”。令人惊讶的是,模型预训练的成本远低于当前顶尖LLM的成本。木明普2025年将被视为中国科技近几十年中最难忘的年份之一。其推理人工智能(AI)模型DeepSeek发布的R1,在性能上可与该领域最强的模型相媲美。 当然,DeepSeek-R1不像反向传播算法或Transformer(转换模型)架构那样是一项突破性的新技术,后者分别引发了深度学习和LLMs(大型语言模型)的两次人工智能革命。反向传播算法也获得了2024年诺贝尔物理学奖。然而,我想强调的是,尽管DeepSeek-R1不是一个从“0到1”的原创突破,但它以前所未有的速度实现了人工智能发展“从1到100”。它清楚地表明,“从1到100”的发展可能比“从0到1”的发展具有更显著的影响。 解放日报:DeepSeek的“从1到100”引发哪些思考? 木明普:有两个问题值得反思。首先,中国的AI研究机构获得了政府的很多资助,近年来发表的论文数量惊人增长,但在AI领域真正有影响力的发现或发明仍然稀少。深求是一家位于杭州的小型AI公司。其负责人梁文峰(Liang Wenfeng)并没有突出的学术背景。他的论文只发表在普通的“技术报告”中,很少受邀在AI学术会议上演讲,但这个年轻的团队却做出了如此有影响力的工作。 其次,人工智能领域存在一个规模法则,该法则认为模型越大、参数数量越多,计算能力和性能就越高。尽管有证据表明该法则正接近其极限,但仍是主流观点。深求(DeepSeek)采取了不同的道路——算法创新。我听到一些人工智能研究者谈论他们不敢如此雄心勃勃,因为风险太高。现在,中国大部分科学界都在进行“从1到10”的渐进式研究,而不是“从0到 1英寸原始突破,也没有“从1到100”的应用价值。但它易于发表这类论文,因此渐进式、小增量研究逐渐盛行。DeepSeek的目标是探索如何实现通用人工智能。1其关键问题在于推理和泛化能力。它们专注于最重要的关键问题,并在有限的资源约束下探索解决方案路径。正是因为它们有激情,并且也有勇气克服重要问题,才取得了跨越式发展。 [“ NEEDHAM 问题”的第二部分] 解放日报每日:从1到10的评分纸很普遍。其背后的深层原因是什么? 木明普:其原因是我们的科学研究受到了欧洲和美国的影响太大。我们只想去紧跟他们,而很少敢超过他们。以神经科学为例。我们的大多数研究都属于“跟进行动”类型,而非“开创性”。 然而,欧美国家的科学研究方法不一定适合我们。我整理了一些统计数据:从1970年到现在,25%的医学或生理学诺贝尔奖直接与神经科学相关,但为什么至今还没有治愈一种脑部疾病?要开发一种药物,从靶点发现到成为上市药物,你必须做“从1到100”的工作。在我看来,欧美科学家更倾向于做能获得诺贝尔奖的最前端“0到1”研究,以及能发表高级别论文的“1到10”研究,还有一些所谓的“原理验证”实验室结果。他们并没有真正参与具有实际应用的后端“10到100”创新研发工作。 众所周知第一“ Needham 问题”,但不知道第二。事实上,他浓缩了两个重要问题。第一个问题是:为什么现代科学没有在中国文明中产生,而只在欧洲发展?这个问题被广泛 已知,他的回答是“官僚封建制”。第二个问题是:为什么从5世纪到13世纪,中国文明在将人类对自然的认识应用于人们的实际需求方面比西方文明更有效,以及它对世界做出了哪些独特的贡献?这个问题并不广为人知,他的回答是“实用主义传统”。 中国现代之前的许多科学技术成就都基于实际应用,并以目标为导向。科学与技术紧密结合。例如,天文学、数学、化学、生物学、工程学和航海技术都与人们的实际需求直接相关。我认为这是一种非常好的科学传统。它与以实际应用为导向的基础研究是一致的,而这种研究现在正在被鼓励。 我经常打比方:科学探索就像在海上捕鱼。目标非常重要:首先你得想好是想要捕大鱼还是小鱼。因为如果目标是捕大鱼,那么捕到一些小鱼后你不会回家。而且,“为了乐趣而捕鱼”的探索和“为了捕大鱼而驱动”的探索之间存在根本区别。我相信当前社会最需要的是“为了捕大鱼而驱动”的科学家,而不是那些只关心“为了乐趣而捕鱼”的人。 解放日报每日:关于DeepSeek的创新文化,最让你印象深刻的是什么? 木明普:他们鼓励自下而上、主动的创新。只要你有好点子,就可以提出来,然后资源都会集中到上面。这和“小团队”的结构关系很大。不管是苹果、微软,还是Meta的前身Facebook,它们最初都是小团队,有些甚至在自己车库里捣鼓。像DeepSeek这样的小团队,在快速闭环互动方面效率更高,专注于既定目标并围绕它凝聚,以及团队成员之间的互联互通精神。希望随着DeepSeek的不断扩张,早期小团队时期建立的文化能够持续保持下去。 中国的大多数科学研究机构无法实现“自下而上、主动创新”。年轻人追求自己想法的空间非常小。 LiberationD日报:如何激发青年研究人员的创新人才? 慕名普:我钦佩麻省理工学院的白head研究员项目 科技。对于有卓越天赋的近期生物学博士毕业生,该计划不要求他们首先进行博士后研究,而是直接为他们提供三年的研究经费和独立的实验室。它在科研人员最具创造力的时期培养年轻科学家。最好的例子是张锋(张锋),在他是怀特黑德研究员期间,取得了诺贝尔奖级别的成果——首次将CRISPR-Cas9基因编辑技术应用于哺乳动物和人类细胞。 另一个例子是杰拉尔德·莫里斯·爱德华曼。在美国洛克菲勒大学读研究生时,他没有固定的导师。他独立进行研究,并因其对抗体化学结构的发现而获得诺贝尔奖。 根据我的建议,中国科学院脑科学与智能技术卓越中心启动了类似青年研究员计划:招聘了三位杰出的近期博士毕业生作为青年研究员,他们拥有自己的独立实验室。经过三年期,如果他们做出杰出工作,可以直接晋升为研究员。迄今为止,这一倡议非常有效。 我甚至还有一个想法:能不能从近几届毕业生中选拔出最优秀的学生,给予他们两到三年的研究资金和资源?这样就不需要分配导师,他们可以根据需要去任何“导师团队”寻求建议。这种环境尤其能鼓励年轻人追求自己的想法。“年轻人无畏”(初生牛犊不怕虎)这句话是有道理的。 [我们还需要研究大脑来推动人工智能吗?] 解放日报每日:人工智能的诞生与神经科学密切相关,人工神经元模型直接受到生物神经元的启发。但为什么现在大多数人工智能研究人员很少关注大脑的工作原理? 木明普:深度学习模型出现之后,先前对脑科学有些兴趣的ai研究人员并没有过多关注它,因为它们非常便捷和强大。他们更依赖数学优化和大规模数据,而不是直接模仿大脑的机制。人工神经网络的深度学习和强化学习模式与大脑的不同。 解放日报每日:大语言模型似乎在很多方面比人脑更强大。我们还需要研究大脑来推动人工智能的发展吗? 木名普:一个大语言模型是一种软件。只有当这种软件是 集成到一个可以真正与环境交互的物理系统中。我相信具有高级具身智能(具身智能)的人形机器人将是未来5到10年中最活跃的领域,但如何将LLMs与感官和运动系统相结合的关键技术尚未克服。例如,要制造一个具有通用人工智能的人形机器人,我们需要一个能与外部世界直接交互的LLM。LLM可以作为机器人的大脑。它需要连接到一个感知外部世界的感官系统和一个输出运动的运动系统。通过这两个物理系统与外部世界交互,LLM可以构建一个不断发展的“世界模型”,该模型可以根据经验进行区分,不断模拟和理解外部世界,从而做出适当的决策和规划。 整合多模态感觉信息正是人脑擅长的。存在一种“鸡尾酒会现象”,即使在嘈杂的环境中,我们仍然能专注于我们感兴趣的人的谈话,同时过滤掉其他无关的噪音。这需要视觉和听觉的有效整合。通过大脑的指令,人体运动系统可以并行和顺序地激活数百块肌肉,以执行平滑和精确的运动。LLM的指令将如何激活这样的运动系统?脑科学可以做出关键贡献。大型模型与物理系统的结合将带来人工智能的下一个飞跃,而脑科学有很多可以贡献的地方。我们需要更加关注研究大脑如何实现高效计算,以及人类智能如何在能够有效与外部世界互动的系统中得到体现。例如, 解放日报每日:大型模型与物理系统的结合——中国大脑计划的第二阶段会考虑这一点吗? 木明普:一些专家已经提出过这个建议。中国脑计划的焦点是“脑科学与脑启发研究”。具有高级具身智能的人形机器人将是一个结合脑科学与脑启发智能技术的优秀平台。 在发展人形机器人等物理系统中的具身智能需要软件工程师、生物工程师和神经科学家之间的紧密跨学科合作。我期待在接下来的五年里看到这一点。