分布式自主科学:科学多样可持续性发展的新范式
中国网/中国发展门户网讯 生成式人工智能(generative artificial intelligence,GAI;AI generated contents,AIGC)系统ChatGPT的问世,标志着人类社会已经开启新的研究范式,即人工智能驱动的科学(artificial intelligence for science,AI4S)与想象智能(imaginative intelligence)的研究时代。人工智能(AI)被广泛应用于文献分析、实验设计、作品展示、知识创作、知识审查,以及编辑出版等领域,极大地提高了科学研究的效率和质量。如今,AI4S成为各国在新一轮科技革命和智能产业变革背景中的核心技术和关键筹码。
AI4S为科学系统带来了前所未有的变革和机遇,也不可避免地加剧了其不确定性、多样性和复杂性。现有科学系统(CeSci)主要基于自上而下的组织结构和制度构建,滞后于智能技术的发展及现实要求。具体表现为:一些项目资助中出现的偏见、低效、知识垄断对科学价值流动的阻碍,以及官僚式等级结构对科学的多样性和开放性的破坏等。过去已有的一些努力试图解决这些问题。如开放科学、研发群体科学(SciTS)等尝试,但收效甚微,这与其所处的时代背景及技术发展阶段相关。
以区块链为代表的Web3技术和分布式自主组织与运营(DAOs)的出现,促使科学系统的资源和注意力重新分配。科学系统以更加快速、高效的方式自下而上资助、组织、培训、规划、协调、调度、收集和分配供需活动,并管理基于网络空间的社区科技资源。这类技术的应用,有望消除研究偏见、信息孤岛及知识垄断等问题,从而将科学价值与所有权归还于知识生产者,并实现科学的多样可持续发展。分布式自主科学(decentralized science,DeSci)是随着Web3技术和DAOs的基础设施的逐渐完善而发展起来的一种新的科学发展范式。DeSci旨在加强科学资助、开放知识、消除对追求利润中介机构的依赖、促进跨领域交流协作。
目前,关于DeSci的研究与应用相对较少。截至2023年3月,尽管各种各样的DeSci组织已经在世界各大城市十分活跃,但可查询且正在运营的公开正式创业型DeSci项目仅约100个。因此,DeSci被许多人误解为AI创业中一个非常初期且应用范围狭窄的赛道或科技生态中“参天大树下的林间灌木和草地”,只适应于“解决小问题、完成小任务”。事实上,回顾科技发展史,科学自诞生以来便以DeSci的形式存在,且与各行各业交织发展。AlphaGo、AlphaFold及时下的ChatGPT,从起步、组织、实施到完成都是货真价实的DeSci实质性成果,与CeSci并无关系。同时,作为新研究范式AI4S的组织和运营方式,DeSci和CeSci必须互相补充、相互促进,才能进而确保科学系统的公开、公平、公正、多样性和可持续发展。本文将从理论层面阐述DeSci的概念、特征及架构,分析DeSci的研究现状与应用现状,探讨和总结DeSci对于科学系统进一步发展的启示与意义。
DeSci的概念、特征及架构
概念与主要特征
DeSci是相对较新的术语,暂无统一的概念。常见的理解为:基于Web3和DAOs构建,使用智能合约、代币(可替代和不可替代)和开源金融工具,特别是去中心化金融(decentralized finance)将科学及科学服务开放化和市场化。如知识产权代币化、科学系统的民主集中治理、同行评审,以及数据或基础设施的访问权限。这种定义是一种局限于Web3技术下的狭义视角;我们可以从更广义的视角来理解DeSci,即DeSci是一种通过智能数字技术融合自下而上与自上而下的决策与服务,是一种集资助、组织、培训、规划、协调、调度、收集、分配供需为一体的生态化科学活动。目前DeSci最大的应用领域是管理基于网络空间的社区科技资源。DeSci是对改进CeSci的集体愿景的呈现。通过智能技术有望使科研机构转变为具有更高效能的数字化组织机构,更好地履行科研职责并具有与人类价值观相一致的能力。DeSci从多方面与现有的CeSci互补。DeSci的主要特征如下。
公平。DeSci正在试图解决CeSci的资助偏见和第三方机构对知识与数据的垄断等问题。科学过程除了基于证据的研究之外,还受到各种人为因素的影响,如社会力量和个人动机。CeSci通常建立在特定的社会等级制度上,不可避免地存在身份、文化、种族、年龄、性别及研究议题的偏见。DeSci通过分布式技术协议和开放性参与权利,吸引边缘化的或排除在科学之外的群体,确保研究群体与议题的多样性、资助的公平性和知识使用的开放性。
自由。DeSci主要通过社区自下而上的努力来解决特定问题。在科学活动的组织过程中,CeSci往往缺乏介入微观活动的能力。DeSci与CeSci互补,有效打破了CeSci对科学活动施加的认知约束以及激励偏见。这使得研究者能够专注于具体问题或研究课题,同时有强烈的动机开展跨学科交流和学科交叉合作。此外,DeSci将数据所有权和价值归还给用户,这将进一步促进数据的自由流动和使用。
负责。可复制性和“科技作恶”是CeSci中的两大难题。前者与缺乏原始数据或数据捏造,以及分析方法越来越复杂和灵活有关,后者则源于科学技术成果的不当使用、滥用及违背社会伦理规范等原因。DeSci是由研究者、资助者、使用者共同组成的生态系统,通过代币化的经济机制激励研究者开放研究方法、代码和数据,这就使得科学研发过程更加透明,“作恶”成本更加高昂,从而降低不负责任的科学行为的产生。
敏捷。高度优化的科学系统难以适应科学中的不确定性,以及应对不稳定性的挑战。DeSci依赖网络社区资源,采用自下而上的运营与治理模式,能够敏捷、高效地应对系统中的不确定性和不稳定性,一定程度上避免了系统为适应多变的环境而形成的自我保护泡沫和次优循环风险。
基本架构
CeSci和DeSci都以知识发现、管理和自动化为目标,但不同之处在于实现这一目标的手段和过程,具体体现在技术栈、组织结构、运营方式等方面(图1)。
智能技术。理想状态下,DeSci由数字人、生物人和机器人的共同协作实现。部分科学工作是由数字人引导生物人和机器人代替生物人完成的。要实现这一工作模式,数字孪生技术、元宇宙技术和Web3技术等起到关键支持作用。数字孪生技术:是DeSci的工程技术,从工程的角度出发,服务于科学系统的数字建模过程,同时与人工智能技术相结合,为构建科学系统的成员群体,尤其是虚拟生物人和机器人,在形态、行为和知识等方面提供技术支持。元宇宙技术:是基于DeSci的场景技术,从场景的角度出发,服务于DeSci功能实现过程,为DeSci构建了组织群体智慧与大规模生产力的场景。Web3技术:是服务于DeSci的网络技术,Web3技术的本质是技术与模式的综合创新,其从生态的角度出发,服务于科学系统的协作过程,实现虚实相生的环境。
组织。DeSci以分布式自主的方式来组织劳动分工、分配资源、划分权责,构建科学社区共有所有权的组织结构。DeSci的组织层面:主要涉及组织形态与治理机制。DeSci的组织形态:可分为分布式多中心、分布式全中心和不对等中心等不同类型。具体表现形式包括基金会+DAO社区和基金会+DAO社区+公司等。这些不同类型的组织形态与DeSci的去中心化程度和应用场景有关。DeSci的治理机制:通常包括链下治理、链上治理、链下治理+链上治理等方式。链上治理是指决策规则被编写进协议,并且任何经过批准的决策都会自动添加进协议。这种治理方式使得去中心化社区能够通过在链上投票直接更新区块链,决策过程通过质押和交易在区块链上进行。链下治理是指决策过程在区块链之外进行,主要通过非正式讨论、改进提案流程或类似方式展开。链下治理具有决策快速和易于达成共识的优势。
运营。自主的协调与执行是DeSci的核心。DeSci采用项目制任务分工协调,并建立了激励驱动的动态自治协调机制,以集体决策的方式在去信任的环境中管理和控制组织的决策过程。DeSci的协调层主要关注决策方法和激励机制。通过组合不同的激励手段和采用不同的激励机制设计,如通证、信誉和治理权力,DeSci能够更好地满足成员的外在和内在需求,从而激励他们更好地分工协作以实现组织目标。同时,DeSci利用智能合约的自动执行能力和智能算法的学习与优化能力,在无需人为干扰的情况下实时可靠地生成并实施面向特定问题的决策。执行层主要包括智能合约和智能算法,能够有效增强DeSci智能性。
DeSci的研究现状与应用现状
DeSci并不是一个全新的概念,不同的学术群体和组织曾提出过类似的观点。其源头是社会运动组织或社会运动群体(SMOs),近段时间就是人肉搜索、众包、动态网民群体组织(CMO或CeMOs)、研发群体之科学(SciTS)、开放化自治社会(DAS或DeSoc)等。本节以区块链技术和智能合约技术等开放化应用技术为追溯源头分析DeSci的研究现状与应用现状。
研究现状
DeSci最早的思想雏形源于2016年联合国开发计划署(UNDP)和青岛智能产业技术研究院(QAII)发起利用SciTS和区块链、智能合约的AI4F2rS2计划。随着DAOs应用场景逐渐丰富,苏黎世联邦理工学院的博士后Martin Etzrodt于2018年从期刊如何解决同行评审及付费墙的角度首次提出DeSci概念。随后,Sarah Hamburg于2021年12月致信Nature期刊提出DeSci运动。此时的DeSci处于提出与号召的阶段,暂无学术研究。
2020年,中国科学院自动化研究所与澳门科技大学联合组建了智能科学与系统联合实验室,该实验室研究领域主要集中于研究平行管理、平行经济与平行社会等,并获得澳门科学技术发展基金委的重点项目资助。2022年该实验室的DeSoc团队在已有的平行DAOs治理工具,即cad2CAS与casCAD2研究基础之上,发表“DAO to DeSci、DeSci研究框架和DeSci的元市场”等系列学术研究成果,填补了DeSci在学术研究领域的空白。
此外,2022年3月21—30日,IEEE Intelligent Systems和IEEE Transactions on Intelligent Vehicles学术期刊,以及2022年9月召开的“IEEE智能交通系统国际会议2022”分别组织了多场DeSci相关的研讨会,旨在探讨DeSci面临的挑战及其对现有科研生态和未来科学活动,及其运营演变的影响。
目前,中国在DeSci领域的理论研究处于全球领先地位。但在DeSci的实践方面严重滞后于西方发达国家,特别是欧洲工业国家。2016年,中国科学院自动化研究所复杂系统管理与控制国家重点实验室的平行智能团队开始专注于区块链和智能合约的研究,并提出了平行区块链和可编程智能合约的研究框架和实现方法[17]。2019年,该团队还提出了DAOs的研究框架及其关键要素。2020年,该团队提出DAOs的平行治理研究方法,并发布DAOs的平行治理系统cad2CAS与casCAD2。2023年,为应对DAOs在实践中遇到的治理权力垄断、代币资源陷阱及决策惰性等问题,该团队进一步提出TAOs,即“真”自主的组织与运营(TRUE autonomous organizations and operations)。这些研究成果为各国在DeSci领域的研究奠定了理论基础。
应用现状
当前,DeSci的应用多集中在科研资助、知识共享以及科学系统的所有权与价值体系的探索。主要应用具体如下。
资助。当前科研资助通常由特定的机构管理和分配。资助机构与被资助者所关注的视角以及知识存在差异,导致资助者的目标与社会最优资助水平不一致,某些研究领域经常被忽视。最为明显的现象是,近年来突破性研究出现的频率在降低,资助资金越来越倾向于资助成功率高、符合当前热点并具有高声誉的研究人员,十分不利于创新的多样性基础之培育。DeSci正在尝试通过DAOs技术和Web3技术,探索新的资助模型。典型的资助机制包括:二次方融资资助、可追溯性公共物品资助、知识产权的不可替代通证(IP-NFT)、资助DAO (Grants DAO)等。例如,DoraHacks作为典型的二次方融资资助平台,从2021年底,开始明确资助DeSci和前沿研究。IP-NFT则是一种利用分布式分类账技术(DLT)来管理知识产权(IP)所有权的新机制。这种模式已在生物技术领域成功应用,如长寿研究Vital DAO、迷幻药研究PhyDAO和计算生命科学研究社区Lab DAO等。Grants DAO是DeSci中最广泛的用例,Grants DAO可以根据DAO的目标设置开放化的资助机制,并在Environment DAO、Klima DAO等得到了成功的应用,有效地推动了环境的保护。开放化资助已经成为Web3重要的组成部分,也是DeSci中最早和相对成熟的实践。
出版与同行评审。同行评审过程为科学成果提供了必要的质量控制,但在当前机制下,期刊出版机构并没有更优化的激励(包括报酬和声誉)评审专家为其提供高质量同行评审的方式。结构性问题导致2个不良循环:①由于找不到愿意审查该工作的评审专家,潜在良好的研究延迟出版;②找到了不匹配的评审专家,导致不良研究成果出版。基于以太坊的开放与隐私同行评审协议Ants Review正在尝试解决其中的部分问题。它允许作者在以太坊上发布公开的匿名同行评审奖励,第三方可以匿名提交评审意见,然后,这些评审意见由外部评审专家审查,根据外部评审专家的意见接受或拒绝评审意见,并按照评审意见的质量发放奖励。OpenAccess DAO正在致力于创建一个公共数据存储库和开放同行评审的平台,以使科学研究更加透明,以及成果可被公开访问;同时,OpenAccess DAO准备建立一个评审者声誉网络,该网络旨在鼓励评审者参与到开放的同行评审过程中来。
数据访问及可复制性。数据可访问是复制研究结果的前提,有效的激励机制可以进一步促进重复研究。这需要一个不可篡改、可验证凭证的系统,允许受信任的各方安全地复制敏感数据,复现研究结果,甚至能让多方协作并向数据集添加新数据。基于Web3技术的数据解决方案支持上述场景,并为科学的开放提供基础。研究人员可以创建无需访问权限或费用的公共物品。例如:开放化气候数据协议dClimate提供开放的全球气候和天气数据访问。DeSci基金会正在试点通过资助以及特定的声誉来鼓励社区复制现有的科学结果。
启示与意义
在一个负责、公平、安全和合乎道德的科学系统上实现AI4S,是科学发展的基石。DeSci在资助、数据开放和民主参与等方面有着独特的优势,但DeSci的发展也面临着探索应用场景、平衡科学社区参与质量及科学过程的问责机制等问题。DeSci的劣势恰恰是CeSci的优势。因此,构建一个科学资源民主化、科学研究多样化及更负责任的科学系统,需要DeSci和CeSci两方面共同努力和有效的合作。
科学资源的民主化。AI4S对于科学资源的民主化是一把双刃剑。一方面,它使有限资源的研究组织和个人利用大语言模型能力快速解决复杂问题和展开科学研究;另一方面,其使用权、可用语料库等却可能加剧科研不平等,尤其是那些身处落后地区或处于边缘化的群体。解决负面问题,需要CeSci和DeSci共同采取一系列措施来推动科学资源的民主化和科学创新。例如,CeSci支持大预言模型的使用权;借用DeSci的资助力量,加大科研投入,特别是资助科研薄弱地区;充分发挥DeSci自下而上调动社区资源的能力,构建无边界科学,促进知识和技术的资源共享等。
科学研究的多样化。AI4S的使用可能会加剧偏见和歧视的问题,因为AI的智能能力是基于大量学习语料库而得的。而算法程序、文本语料可能蕴含特定的价值形态,特别是在性别、种族、地域、文化等方面,这意味着训练出来的模型也存在偏见和歧视。再加之,输出结果和内容又可以根据个人的偏好进行调整,导致个人偏见得到进一步自我强化。在AI4S的背景之下,CeSci的特定目标导向性特征难以满足科学研究的多样性,但是可以通过制定相应的政策法规来构建DeSci与CeSci的合作桥梁,促进创新生态DeSci发展。借助DeSci的组织结构和运营手段来进一步促进研究群体与议题的多样性、资助的公平性,以及无国界的交叉学科、跨学科、多学科的交流与合作。
更负责任的设计与合乎道德的使用。大语言模型的输入与输出过程是一个不透明的“黑箱”,不良算法设计、决策和行为可能会引发安全隐患及伦理冲突。为确保AI4S系统的可持续性发展,需要实施强有力的安全措施。① DeSci与CeSci共同推动算法标准开源,确保AI系统的设计和实现是可靠的。②通过在DeSci社区建立审核机制来确保数据源的质量和多样性,从而消除AI系统可能存在的歧视性。③强化技术理性和算法伦理的教育培训,提高对AI技术的认识,了解如何更好地使用和设计AI系统,以确保其合道德和法律标准。④人工干预来监督AI系统的行为,并在必要时进行纠正。这些措施的实施离不开CeSci和DeSci的共同努力,只有CeSci和DeSci携手共进,才能建立更加负责和可持续的AI4S系统。
在AI4S的科学范式中,确保科学系统的公正性、多样性是非常重要的,因为只有这样才能真正发挥科学研究的价值,并为智能科学的可持续发展奠定坚实的基础。随着人工智能大模型不断成熟、生成式人工智能发展愈发深入,DeSci将成为学术活动必不可少的形式,与CeSci共同应对未来科研的复杂性。CeSci、DeSci、AI4S互相补充、互相促进,也将形成一种新的科学范式——平行科学。平行科学基于平行智能理论和技术,利用数字人、理论科学家和机器人工程师构建平行物理、平行化学、平行材料、平行生物、平行医学、平行经济、平行艺术、平行哲学等学科。平行科学的发展可以促进不同领域之间的交流和合作,加速科学研究成果转化过程,为智能产业和智慧社会的发展奠定基础,提供保障。
(作者:王飞跃,中国科学院自动化研究所 复杂系统管理与控制国家重点实验室、澳门科技大学 创新工程学院;丁文文,澳门科技大学 创新工程学院;编审:金婷;《中国科学院院刊》供稿)