|
微生物资源大数据平台建设
世界微生物数据中心落户中国
世界微生物数据中心(World Data Center for Microorganism,WDCM)成立于 1966 年,隶属于世界微生物菌种保藏联合会(WFCC)和联合国教科文组织下的全球生物资源中心网络(GBRCN),是全球微生物领域最重要的实物资源数据中心。经过全球竞争,2010 年世界微生物数据中心(WDCM)正式落户于中国科学院微生物研究所。这是落户于我国生命科学领域的第一个世界数据中心,其落户中国标志着我国微生物学研究领域在国际上影响力的大幅提升,也给中国微生物资源研究与利用带来了巨大的发展机遇。迄今,全球共有 76 个国家的 755 个微生物资源保藏中心在 WDCM 注册。
WDCM 建设和维护了与微生物资源相关的一系列重要数据库,包括全球微生物保藏机构数据库(Culture Collections Information Worldwide,CCINFO)、全球微生物菌种资源目录(Global Catalogue of Microorganism,GCM)、全球微生物参考菌株数据库(Reference Strain Catalogue,RSC)、微生物资源引用数据库(Analyzer of Bioresources citation,ABC)等,是全球微生物领域最重要的实物资源数据平台。
在大数据整合技术研究方面,WDCM 团队开发了生物资源引用平台系统,利用先进的数据挖掘手段,从全球超过 600 万已发表的微生物相关文献、专利、核酸序列和基因组中,进一步提取了微生物资源的后续研究和利用的信息,并开发了参考菌株目录。作为一个跨平台参考目录,该目录整合 ISO 以及其他国际标准菌种统一编号,推动了全球菌种资源的高标准应用。在数据集成和服务机制上,WDCM 团队也进行了积极的探索,使得该平台能够有效地在全球范围进行数据资源的集成,并实现可持续发展。同时,WDCM 作为一个合作平台,使我国科学家能够在全球的角度,组织和协调各国的相关力量,建立全球性的合作框架,也让中国有机会逐步在微生物资源的开发应用和数据共享方面占领国际微生物研究前沿和主导地位。截至2018年7月底,平台的累计访问次数已超过 20 万次。
倡导全球微生物资源目录合作计划(GCM 1.0),推动微生物数据资源共享利用
为了推动全球微生物数据资源的共享和利用,更好地整合不同来源、不同数据格式的微生物相关的数据,WDCM 于 2016 年 9月6日在全球保藏中心之间提出了“全球微生物菌种资源目录国际合作计划”(Global Catalogue of Microorganism),旨在为目前分散在全球各个保藏中心和科学家手中珍贵的微生物资源提供一个全球统一的数据门户。此门户系统覆盖主要保藏中心的重要微生物资源,并且包括微生物资源在采集、鉴定、保藏和应用方面的详细信息。这一国际合作计划建立起了一套统一的全球微生物菌种目录,对主要保藏中心的目录进行标准化整理,提供统一的检索出口。同时,在该目录中集成利用自动化的知识挖掘方法得到的关于微生物资源的文献、专利、序列、基因组等其他知识资源,并开发多种途径的数据检索工具以及数据推送、数据定制服务。
这项计划由中国科学院微生物研究所微生物资源与大数据中心负责具体的信息平台建设、数据标准建立、数据集成与共享实施。目前,已经有来自美国、法国、德国、日本等 46 个国家的 120 个国际微生物资源中心正式加入,40 万株微生物实物资源的信息汇集到中国团队开发的数据平台。