微信邦

 找回密码
 立即注册

QQ登录

只需一步,快速开始

查看: 34|回复: 0

2025年,AI到底会给科学界带来怎样的变化?

[复制链接]
发表于 2025-2-17 08:57:28 | 显示全部楼层 |阅读模式
科学四十人圆桌活动现场图。从左至右依次为:清华大学苏世民书院院长、人工智能国际治理研究院院长薛澜,北京大学理学部副主任、化学与分子工程学院教授、生物医学前沿创新中心研究员高毅勤,北京邮电大学信息与通信工程学院教授、科学探索奖得主王光宇,清华大学计算机系教授、智能技术与系统实验室副主任黄民烈。

在AI for science以及很多领域,AI的突飞猛进让⼈兴奋和激动;同时,AI可能的影响和导致的后果也让我们担心。AI将把我们带往何处?怎么才能做到AI for good?

围绕这些问题,与2025新年科学演讲同期举行的科学四十人圆桌,邀请到北京大学理学部副主任、化学与分子工程学院教授、生物医学前沿创新中心研究员高毅勤,清华大学计算机系教授、智能技术与系统实验室副主任黄民烈,北京邮电大学信息与通信工程学院教授、科学探索奖得主王光宇,主持人为清华大学苏世民书院院长、人工智能国际治理研究院院长薛澜。

此后的快闪接力发言由《知识分子》总编辑、中国科普作家协会理事长、中国科学院院士周忠和主持,《知识分子》总编辑、大湾区大学讲席教授夏志宏,中国科学院自动化所研究员王飞跃,86岁的原中国科院大学党委书记颜基义,首都医科大学校长饶毅等多位学者也分享了自己的观点。

在科学四十人圆桌之前,香港大学计算与数据科学研究院院长马毅发表演讲,提出“百模大战”资源消耗惊人,智能本质到底是什么?亚马逊云科技上海人工智能研究院院长张峥发表演讲,提出在人工智能时代,更要像文艺复兴时期一样思考。(港大马毅:“百模大战”资源消耗惊人,智能本质到底是什么?、张峥演讲:在人工智能时代,更要像文艺复兴时期一样思考)

在这场讨论碰撞中,学者们分享了一些非常有价值、有意思的观点。比如:
——AI具体给哪些学科带来了范式革命?AI能否提出创新的想法,还是可能阻碍科研人员的创新?AI是不是科学史上最特别的存在?AI对科学影响的深刻程度,能否与相对论或量子力学相比?
——AI for Science面临怎样的关键挑战?如何构建可信的科学数据共享模式,如何解决长尾分布、数据污染和数据多样性的问题?
——如果说目前人工智能的所有数学表达公式都基于概率论,概率最大的事情就是正确的,而人类所有的原创性工作本质上都是小概率事件。那么,在现代人工智能的框架下,还需要担心AI会超越人类吗?
——如果我们被大量人工生产的内容包围,再难发现事实、真相、真理,又没有清理这些内容的能力,该如何预防这样的未来?当内容由AI生成,目前又能否用AI的方法识别?
——AI作为心理咨询师,能否达到中级咨询师的水平?以及,AI自身会不会“抑郁”呢?

以下为科学四十人圆桌讨论及随后的快闪发言实录。

撰文 | 知识分子

●                   ●                    ●

薛澜:今天我们聚焦人工智能,尤其是它在科学研究中的应用。过去一年,AI在科学研究领域迎来了关键节点,不少诺贝尔奖成果都与AI相关,这充分证明了AI的潜力,它正在深刻改变着社会的方方面面。然而,也有人担心,未来科学研究会不会被AI完全牵着鼻子走?AI究竟能改变什么,又不能改变什么?这些问题都值得我们深思。

今天,我们有幸邀请到几位在AI应用领域深耕的科学家,他们将分享AI在科学、医学甚至心理健康领域的应用实践。

高毅勤:我是做化学的,具体是理论化学和计算化学。我的研究主要是从分子出发,研究分子的物理过程,包括分子的结构以及它们之间的相互作用。我们试图通过这些物理规律来理解生命的本质,以及分子在生物过程中的功能。

我们为什么引入AI呢?我的专业主要是理论推导和科学计算。生命过程的分子世界极其复杂,小分子的可能性有10的200次方种,药物分子个数也高达10的60次方,这是一个巨大的数字。蛋白质的可能性也非常多。如果完全从量子力学的角度出发,从分子和原子层面理解生命过程,是非常困难的。在过去的研究中,我们试图从微观逐渐理解到宏观,但这几乎是不可能的,因为两者之间的差距太大,可能性也太多。

而深度学习为我们带来了新的可能。我们可以对所有分子进行压缩表示,找到它们与宏观现象真正相关的特征。人工智能技术可以与科学计算有效结合,比如通过强化学习,在微观和宏观或介观层面同时推进,更快、更有目的地闭环学习。这样,我们对生命基于分子的理解就能产生更多基于科学原理的数据。

王光宇:我的研究方向是智能信息处理和生物医学计算。概括来说,我的工作主要是希望通过智能信息处理手段,深入分析和解析多源且复杂的生物医学数据,实现对疾病的刻画、预测或调控。

围绕着AI for Science,我认为有三个关键层面,我们的工作也与之密切相关。首先是大规模数据协作。我们知道,丰富多样的科学数据对构建AI for Science的能力至关重要,但传统的科研流程中,实验复杂性和数据共享目前仍是一个挑战。如何构建可信的科学数据共享模式,是我们非常关心的问题。从技术层面来看,我们团队面向生物医学复杂的场景,构建了可信的隐私计算平台,能够弹性适配并支持科研机构合作,这属于底层信息基础建设方面的。

在中间层,是智能算法和模型的创新。我们正在构建基于基础大模型的生物医学计算框架,最近发布了一个1760亿参数的生物医学基础模型,通过在海量的科学大数据训练模型,使其具备生物医学知识与能力。我们希望通过这样的工具,来加速下游任务的新发现或新工具的使用。在应用层面,可以通过数据微调来处理长尾分布的任务或罕见疾病问题。

最后,我们希望通过这些工具结合生成式AI,生成大量的假设或实验方案,从而拓展人类对科学假设的新灵感。通过这样系统性的工作,能够推动AI for Science领域的研究。

黄民烈:我领导的研究小组主要在做两件事情。第一是AI的安全和对齐。安全是大模型最重要的研究方向之一。我们开发算法让模型更快地对齐各种价值观和偏好,让它变得更安全、更可靠、更可信。我们在AI治理、AI安全以及政策法规制定方面,也跟薛老师有各种各样的讨论,为了以后有更多的合作。

第二是AI for 心理健康。2016年,英国媒体曾预测心理咨询师是人类最不可能被AI替代的工作之一,但如今回头看,我认为AI咨询师替代的可能性越来越大。随着研究的深入,我越来越确信这一点。其实早在1966年,MIT的教授就开发了Eliza,是最早的AI心理咨询师,当时效果还挺好的。如今,大模型的发展让我们可以预见,AI作为心理咨询师达到中级咨询师水平是非常有可能的。

在我的研究小组里,我们试图让计算机理解情绪、表达共情、理解人类的认知、心智和思维,以及预测人在社交场合中的潜在行为。从更大的层面来说,我们希望通过这些研究让AI具备更好的社交智能,能够理解人的情感、思维和行为背后的动机。

其实从更宏观的角度来看,我们今天开发的所有大模型,最终目标都是为了提升生产效率、创造力和工作效率,进而提高整体的劳动生产效率。而我们团队的研究方向则是让AI具备更强的社交智能,使其能够真正理解人的情感、思维和行为,以及这些行为背后的潜在动机。

AI for 心理健康是一个重要的应用场景。目前,我们已经在中小学和全国的大学推广AI应用,比如基于AI的访谈,它可以代替人与人之间的聊天,给出初步的心理状态评估,同时提供AI陪伴工具,帮助人们疏解情绪压力,更好地应对各种压力。此外,我们还开发了培训咨询师的工具,通过更好的培训和反馈,帮助咨询师更快提升咨询技能。

01
AI for Science:跨学科合作与专业领域挑战

薛澜:请教各位科学家在用人工智能工具时,是自己学会用这些大模型,还是也会和学人工智能的学者合作呢?另外,在使用AI for Science的过程中,你们觉得有哪些关键挑战?刚才提到数据问题,那算力呢?目前有没有遇到什么具体问题,又是怎么解决的?

黄民烈:作为计算机科学家,我们擅长的是数据和算法。不过,今天我们确实面临一些问题。

首先,关于数据污染的问题。这会影响我们下一步如何训练大模型,以及如何让它进一步迭代和提升。我们也在尝试一些自对齐的方法,让模型能够自主进化,但仍然面临长尾分布和数据多样性的问题。

其次,当我们深入到行业的解决方案时,比如AI用于心理健康,这并不是一个简单的通用模型能够解决的问题。它需要深入到行业内部,不能仅仅依靠简单的数据训练。我们需要行业专家来注入专业知识,并提供更好的评估。比如,我们开发的AI咨询师,如何判断它是否达到了中级或初级咨询师的水平?这就需要像北师大这样有实际咨询经验的专家来告诉我们,目前的水平如何,还存在哪些问题。

心理学领域有很多专业知识,我们对此必须保持敬畏之心。如果希望这些工具真正帮助到更多人,情感、心智和认知的问题是非常个体化和长尾的。比如失恋,原因可能多种多样:性格问题、相处问题,或者压力太大不想恋爱……每个人的情况都不一样。这就要求我们在行业基础上进行深度钻研,与心理学的学生和专家合作,怀着一颗敬畏的心,以确保这些工具在真实场景中真正可用。

高毅勤:实际上在分子领域,模型和通用模型有很大的不同。比如,分子可以想象成一个三维图像,但它不仅仅是图像,它需要符合量子力学的规律,并且要保持对称性。通用模型在这方面是无法满足要求的,所以我们需要自己开发模型。

当然,问题不止于此。在生命科学领域,普通的Transformer架构也会面临一些问题,比如灾难性遗忘。但在真实的物理世界中,这些问题本身是有科学规律可循的,这就需要我们开发新的算法和框架。

虽然我们自己也会写代码,比如我之前写过分子动力学模拟的代码,但在工程化的过程中,我们仍然需要外部帮助。我们和国内的很多厂商,比如华为、曙光集团等,都有大量的合作。从深度学习框架的早期开发阶段开始,我们就会提出一些科学问题。我特别想强调的是,专业领域的知识不仅仅是对AI提出要求,也对AI的算法、框架甚至硬件提出了新的要求和启示。

王光宇:从通用领域到专业领域,通用大模型在专业场景下的适用性是有限的。尤其是生物医学开放领域,场景本身就非常复杂,不仅包含互联网知识之外的大量专业知识,而且数据模态也更加复杂,具有高维度、跨尺度、科学规律约束的特点。这就意味着我们不能直接使用通用大模型,而需要针对专业领域开发自己的基础大模型。在生物医学领域,比如罕见病的推理诊断方面,通用大模型的表现并不理想。此外,专业领域的推理任务通常更加复杂,可能涉及多步推理、不确定性估计等问题。

02
从AlphaGo到AlphaFold:AI如何重塑科学研究?
薛澜:刚才提到人工智能可以帮助提出假设,这让我有点好奇。在大家的印象中,人工智能擅长解决重复性问题,比如像解谜题一样快速给出答案。但它能不能识别出新的科学问题,或者发现反常现象,甚至提出创新的想法呢?在这方面,人工智能究竟能做些什么?

王光宇:这个问题确实很有挑战性。在我看来,生成式AI的出现与我们过去做的优化工作有很大不同。生成式AI的核心在于“生成”,它能够提出大量新的假设和方案,从而拓展科研的问题空间和解空间。比如在数学研究中,科学家们通过与AI的交互来获取一些可能的解决方案,然后在这些基础上进行逻辑推理。这种新型人机协作的方式,极大地提高了效率。

然而另外一方面值得警惕的是AI带来创造力方面的风险,目前AI的训练大多是基于已有数据的拟合,而在其训练数据中往往会最小化异常值。但很多时候,人类科学发现正是通过对异常值的关注来取得突破的。这就引出了一个问题:现有AI的这种训练方式是否会阻碍人类的创新,减少了偶然性发现?我认为这是有可能的。

不过,我也相信随着研究的不断深入,比如现在的个性化大模型技术的发展,未来能避免同质化研究问题等,同时人机协作会更加紧密。通过这种方式,我们或许能够更好地解决这个问题,让AI真正成为推动科学发现的重要工具。

黄民烈:我觉得这是有可能的。对于创造性问题或新的假设,往往是长尾分布的。但目前的大模型在训练时,会倾向于高估常见事件,而低估长尾事件。换句话说,它会认为长尾事件的概率比实际发生的概率更低。

这就带来了一个难点:我们如何设计采样方法或算法,来提出新的假设?我觉得这是可行的。比如AlphaGo曾经下出过一些人类棋手从未下过的“上帝之手”,这些招法经过人类验证后,就成为了新的知识。所以,AI确实有可能提出创新性的假设,关键在于我们如何更好地处理长尾数据,通过算法设计捕捉到这些低频事件,并通过验证将其转化为知识。这或许可以成为一种基本的逻辑。

高毅勤:我也有同感。在一些复杂体系或复杂系统中,当现象、数据或相互作用的模式变得极为复杂时,人类的抽象能力和想象力可能会达到极限。但在这种情况下,通过数据压缩和感知,AI有可能发现一些令人惊叹的关系。这些隐藏在背后的逻辑关系,或许反而更容易被AI挖掘出来。不过,人的积极参与、深度思考以及对更底层逻辑的探寻,仍然是实现这一目标的关键因素。只有人机结合,才能真正发挥出AI在复杂系统中的潜力。

03
AI的未来:科学突破还是边际收益递减?

薛澜:去年好几个诺贝尔奖都和人工智能相关。我想问问各位,这只是一个特例,还是说未来这种情况可能会经常出现?换句话说,人工智能的研究,或者与人工智能相关的研究,是否会在不同科学领域持续引导出突破性的成果呢?

黄民烈:我觉得未来这种情况可能不会太多。比如Hinton获得物理学奖,这既让人意外,又在情理之中。他最有名的工作是玻耳兹曼机,这是基于物理学原理开发的。他甚至说过,他一生中最骄傲的工作就是玻耳兹曼机。包括这次化学奖AlphaFold,确实很有影响力,但成果大多是“摘低垂的果实”,类似这样的工作未来可能会减少,可能会面临边际收益递减的问题,导致未来获得诺贝尔奖的概率也会更低。

王光宇:我觉得还是有一些可能性的,至少在科学领域,比如AI有可能会在诺贝尔生理学或医学奖方面取得突破。我们可以看到,现有的实验科学研究面临很大的瓶颈:从假设到做实验的周期很长,很多时候只是局部优化,且受限于数据采集与模拟空间,难以实现全局性地发现科学规律。但AI能够有效建模和挖掘高维科研数据,捕捉潜在科学规律,突破这些局限,进而加速整个科研过程,甚至帮助人类找到尚未攻克的重大疾病的解决方案。毕竟,人类仍面临还有很多亟待解决的疾病问题,比如肿瘤。我非常希望我们能通过AI的方法创新,在这方面取得一些突破。

高毅勤:我也觉得这种情况还是很有可能的,至少在两个方面有较大潜力。首先,就像AlphaFold一样,虽然表面上看似解决了蛋白质结构问题,但它真正的作用是帮助我们理解蛋白质之间的相互作用,以及细胞的特异性。这或许会带来新的研究范式和科学发现。其次,在算法方面,随着我们对生物过程的理解不断加深,我们可以将生物过程视为一种算法。这可能会反向启示我们,如何将这些基于物质世界的相互作用转化为数学算法。这不仅对智能的理解和未来发展,也会带来很多新的机会。我觉得这只是一个开始。

04
AI vs. 传统工具:为何AI需要特别对待?





薛澜:我们此前也收集了一些观众问题请教各位老师,比如,人类从成为人类以来,发明的机器或工具不计其数,那么是什么将AI与此前任何工具机器区别开来以至于需要特别地考虑AI for science,AI for good?

王光宇:其实AI之前也有很多科学工具,比如计算仿真工具,但为什么我们认为AI代表着一个新的科学范式呢?首先,AI的本质是让机器具备类似人类的能力,随着大模型的发展,AI在一定程度上已经具备了丰富的知识和推理能力,可以在很多层面帮助我们改变科研范式。

比如在工具层面,现在许多学生已经开始使用大模型作为科研工具。它可以自动读文献、帮助梳理和生成研究方案等。过去,科研的门槛很高,需要掌握多种工具,但大模型的出现把很多工具进行了整合,方便调用,从而大大降低了科研的门槛。从这个角度看,AI对科学研究的推动作用是“平权化”的。

在研究范式层面,过去的科研大多是假设驱动的,但现在AI可以基于数据直接产生可能的科学假设,然后再由人类进行验证,这是一种数据密集型驱动的新模式。同时,AI作为一个工具,在提出假设后还能够更好地挖掘高维、非线性、复杂数据中的规律,并在整个研究过程中提供帮助或模拟结果,形成了“AI in the loop”研究闭环,这在过去是很难做到的。所以,我觉得AI不仅仅是一个简单的工具,它正在引发一场全新的科学发现变革。

高毅勤:我并不觉得AI一定是人类科学史上最特别的存在。一方面,因为我们身处其中,很容易感受到它的变化。另一方面,现在的传播方式也让我们觉得AI的影响力铺天盖地。但如果我们回过头去比较,AI带来的变化真的比量子力学的提出更深刻、更伟大吗?真的比微积分的发明对世界的认知和改变更深远吗?我觉得这还需要时间来验证。

05
AI时代的职业变革
薛澜:下面的问题是,在大模型等技术的加持下,未来的四足/人形机器人/机器手能否低成本完成人类所有/绝大部分体力劳动?换句话说,今后的科研人员是不是不需要那么多了,甚至于有一天会被替代?文科还有没有未来?

回复

使用道具 举报

您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

微信邦网联系QQ|Archiver|手机版|小黑屋|鲁公网安备 37082802000167号|微信邦 ( 鲁ICP备19043418号-5 )

GMT+8, 2025-3-17 17:18 , Processed in 0.129260 second(s), 19 queries .

Powered by Discuz! X3.4

© 2001-2013 Wxuse Inc. | Style by ytl QQ:1400069288

快速回复 返回顶部 返回列表