地球科学大数据研究主题演化与影响力分析

发布时间:2021-08-27 09:18:44  |  来源:中国网·中国发展门户网  |  作者:安培浚、李佳蕾 等  |  责任编辑:张蔚蓝
关键词:地球科学大数据,文献计量,研究主题分布,研究热点演化,研究影响力

中国网/中国发展门户网讯 1998 年时任美国副总统戈尔提出数字地球概念——将数字地球看成是对地球的三维多分辨率表示,并能放入大量地理数据。自此,地球大数据概念和相关研究开始走进大众视野。而在科学研究领域,地球大数据的研究及其应用其实早已开始。1954 年,基于系列海洋数据分析了热比容偏差;1959 年,基于卫星数据对大气进行分析;随着美国陆地(Landsat)系列卫星的发射,1976 年起地球科学与大数据相关研究论文明显增多,大多为基于卫星数据开展分析,主要应用于地质和矿产资源勘探、作物面积和土地利用分类估算、大气成分和云层状况研究、冰冻预报、卫星和遥感数据处理技术等。

 

随着计算机互联网、卫星定位系统、空间信息技术、高分辨率卫星影像、大数据处理与存储技术、科学计算及可视化、虚拟现实技术等现代信息科技的迅猛发展,地球大数据的深入应用将对全球和各国的科技、经济和社会生活产生巨大影响。因此,地球大数据相关理论与技术方法研究成为当前研究热点领域。本文基于文献计量方法,对地球大数据研究主题演化与影响力进行分析,以期为相关领域研究提供参考。

 

数据源与研究方法

利用“地球科学”和“大数据”主题组合检索策略构建检索词和检索式(广义的),采集文献覆盖面广与影响力大的科学引文索引(SCI)和社会科学引文索引(SSCI)数据库的所有文献数据(截至 2021 年 7 月 20 日)。经过对机构和关键词等信息的清洗,并经专家识别排除不相关文献后,利用多种可视化分析工具,定量分析地球大数据研究的现状与研究主题变化情况。

 

地球大数据研究总体科研产出分析

全球地球大数据论文增长趋势

地球大数据研究年发文量变化可以反映出其研究变迁与研究热度。图 1 展示了全球地球大数据相关研究年度发文量的变化趋势。数据显示,1990 年以前,地球大数据相关研究论文还非常少;1991—2000 年,论文数量开始保持小幅增长;2000 年以来,论文增长进入快车道;2017 年之后更呈现暴发式增长态势。

 


地球大数据研究论文占全球论文比重可以更直观地反映该领域受全球关注程度。图 2 统计了 1954—2020 年地球大数据相关论文占 SCI/SSCI 年出版论文的比重,1990 年以后,地球大数据相关研究论文占全球论文比重呈现逐步增长的态势;特别是 2012 年之后,增长更加迅猛;2020 年,地球大数据相关研究论文占全球比重已达到 0.25%。

 

全球国家与机构的科研影响力分析

地球大数据相关研究论文主要分布在全球近 200个国家/地区。表 1 基于论文总被引频次列出论文影响力最高的 15 个国家/地区及其论文数、篇均被引频次、论文数全球占比和近 10 年(2011—2021 年)美国科技信息研究所基本科学指标数据库(ESI)前 1% 高被引论文全球占比。美国涉及地球科学的大数据研究(广义领域)起步较早,在论文数、论文总体影响力、篇均被引频次、高被引论文等指标上都表现较好。首次明确提出地球大数据与大数据科学的概念(具体领域)是中国的科学家。2015 年 6 月 17—18 日,在北京举行的“空间地球大数据”科学与技术前沿论坛上,郭华东报告中首次探讨了空间地球大数据理念、科学内涵、与数字地球关系,以及对推动地球系统科学及全球变化研究发展的潜力;2016年,郭华东及其团队在《科学通报》发表的《空间地球观测数据成为地球科学新引擎》一文正式使用地球大数据概念;2017 年,郭华东牵头创办了全球地球科学领域的第一个大数据刊物Big Earth Data,并在创刊号上发文,提出地球大数据科学的概念。目前,中国已成为地球科学大数据的研究大国,年相关论文产出超过美国,在国际地球大数据科学领域的研究处于引领地位。

 


 3 可视化展示了地球大数据相关研究论文产出最多的 15 个国家/地区的年度论文数量变化,主要国家/地区相关论文产出均呈增长态势。2000 年以前,美国发表的相关论文占全球至少一半以上;2010 年以后,中国相关论文增长很快,德国、澳大利亚、英国等国相关论文也有明显增长;自 2018 年起,中国年相关论文年产出已超过美国。

 

 2 分别统计了全球地球大数据领域发文最多和论文总被引频次最高的 25 个机构。发文最多的 25 个机构分布在美国、中国、法国、俄罗斯、意大利、印度等国,其中美国 13 个,中国 8 个,法国、俄罗斯、意大利、印度各 1 个;论文总被引频次最高的 25 个机构分布在美国、中国、法国、意大利、加拿大等国,其中美国 19 个,中国 3 个,法国、意大利、加拿大各 1 个。

 

中国在地球大数据领域发文从论文数量和论文总被引频次来看,中国科学院、北京师范大学和武汉大学是国内 3 个最主要的研究机构。北京师范大学开展地球大数据研究的主要单元为中国科学院遥感与数字地球研究所和北京师范大学联合建设的遥感科学国家重点实验室;同时,北京师范大学地理科学学部设置了地理数据与应用分析中心,开展地理空间数据建设、计算平台搭建,以及利用多源数据开展地理学过程分析,中心下设数据存储与计算实验室、地理数据服务研究所和地理大数据研究所。武汉大学遥感信息工程学院和测绘学院是该校开展地球大数据研究的主要研究单元。

 

地球大数据研究领域分布

论文所属期刊情况

基于美国科学信息研究所《期刊引用报告》(JCR)期刊分类对地球大数据相关研究论文所属期刊学科领域进行分析发现,地球大数据相关研究论文所属期刊分布在 200 多个主题类目中,大部分为自然科学,也有少量为社会科学和人文科学,图 4 为分布最多的 40 个主题类目。遥感、环境科学、影像科学与摄影技术、地球科学多学科、气象与大气科学为分布最多的 5 个主题领域。


根据统计,地球大数据相关论文分布在SCI 收录的 4000 余种期刊、丛书、图书中。其中,发文最多的 20 种期刊中发表的相关论文占全部相关论文一半以上(图 5)。Remote SensingInternational Journal of Remote SensingRemote Sensing of EnvironmentJournal of Geophysical Research emdash AtmospheresIEEE Transactions on Geoscience and Remote Sensing 是发表相关论文最多的 5 个期刊。

 

论文所属研究主题情况

InCites开发了一种基于论文引用的分类算法。随着已发表论文的相互引用,这些引用关系的强度将相关文献汇聚到一起,形成离散的相关文献集群。这些集群构成了引文主题(Citation Topics)的核心,独立于单篇文献的主题和内容,却代表着作者相互积极引用对方论文的领域。Citation Topics 构建一个宏观、中观和微观主题的 3 级层次结构,包含 10 个广义集群、326 个中观集群和 2 444 个微观集群的层次结构。根据聚类内容对宏观和中观类别进行了标注,由于微观Citation Topics数量较多,使用算法工具根据聚类文献中最重要的关键词给每个主题加标注,从而有助于对研究主题进行更精细的分析。基于 InCites 的 Citation Topics 分类,对地球大数据相关研究论文的主题分布进行分析。

 

基于 Citation Topics的宏观领域分布。地球大数据相关研究论文主要分布在电气工程、电子学与计算机科学,地球科学,农业、环境与生态三大领域。这表明信息技术是地球大数据研究最主要的研究基础;而地球科学,农业、环境和生态领域是地球大数据的主要应用领域(图 6)。

基于Citation Topics分类的地球大数据相关研究论文中观领域分布。研究主题主要集中在遥感,海洋学、气象与大气科学,林业等领域(图7)。

 


基于Citation Topics分类的地球大数据相关研究论文微观领域分布。研究主题主要集中在归一化植被指数、蒸散发、气溶胶、海洋颜色、自发地理信息、冰川、云、生态系统服务、厄尔尼诺与南方涛动、热带气旋等(图8)。

 

专业期刊关键词分布情况

SCI 数据库目前仅收录 2 种地球大数据领域专业期刊——Earth System Science Data 和 Geoscience Data JournalEarth System Science Data 创刊于 2009 年,2012 年开始被 SCI 收录,目前为 JCR 地球科学“多学科”领域 1 区期刊,“气象与大气科学”领域 1 区期刊;Geoscience Data Journal 创刊于 2014 年,2015 年被 SCI 收录,目前该刊为 JCR 地球科学“多学科”领域 3 区期刊,“气象与大气科学”领域 4 区期刊(2020 版 JCR)。截至 2021 年 8 月,SCI 数据库共收录了以上 2 刊的 893 篇论文。

 

Earth System Science Data 和 Geoscience Data Journal 发表的 SCI 论文的主题分布进行分析,基于其所发表论文的“作者关键词”,绘制了关键词共现网络。如图 9 显示,两刊发表论文研究主题涉及气候与天气、气候变化、大气温度、降雨、观测、重构、水文模型、海面温度等广泛主题,热点关键词主要有数据救援/气候数据救援(climate data rescue)、公民科学(citizen science)等。

 


地球大数据研究热点演化

提取不同时期相关论文最多的 20 个主题,并用热力色阶表示各主题在不同时期相关论文多少,颜色越接近红色表明文献量越大,颜色越接近蓝色表明文献越少(表 3)。从表 3 可以看到,不同时期研究热点有较多不同。2000 年以前,更关注归一化植被指数、云、厄尔尼诺与南方涛动、蒸散发、热带气旋、内波、自发地理信息、海洋的颜色、冰川、地统计学。2016 年以来,更关注归一化植被指数、蒸散发、气溶胶、海洋颜色、生态系统服务、冰川、自发地理信息、激光雷达、城市热岛、地学统计;此外,深度学习、滑坡、森林火灾、光污染、城市热岛效应等主题的相关文献数量增长较快。

 

 11—14 基于“作者关键词”可视化展示了不同时期相关研究论文的 300 个高频关键词聚类网络,从而可以一窥不同时期的主要热点研究主题。每幅图中用同一颜色代表同一个聚类。节点大小和节点字体大小表示该节点论文数量多少。可以看到不同时期热点研究主题发生了一些变化。



 

地球大数据研究的国际合作情况

主要国家间的国际合作

 15 可视化展示了地球大数据研究相关论文最多的 50 个国家/地区间合作密度,其中美国、中国、加拿大、英国、德国等国家/地区的国际合作强度最大。

 

 4 统计了地球大数据相关研究论文发文量最多的 25 个国家/地区的国际合作论文占本国相关论文比重。数据显示,大部分国家/地区的国际合作论文所占比重均超过一半以上,国际合作论文比重占比较低的有印度、土耳其、中国。

 


中国主要国际合作伙伴

 16 显示了在地球大数据领域,与中国开展相关研究论文国际合作最多的 25 个国家,其中连线粗细表示与中国合作论文数量多少。中国国际合作论文最多的国家是美国、英国、加拿大、澳大利亚、德国、法国、日本、荷兰、意大利、韩国、比利时。中国发表的地球大数据相关研究论文中,近 10% 的论文为 3 国及以上国家合作完成。

 

 5 统计了地球大数据相关研究中,与中国合作论文最多的 25 个国外机构。统计显示,中国的国际合作机构主要分布在美国,美国马里兰大学、法国国家科学研究中心、美国国家航空航天局是中国地球大数据领域最主要的 3 个海外合作机构。

 


结论与展望

近年来互联网、云计算和人工智能等相关技术发展,使得地球大数据研究热度升高,发文量增长迅速,影响力呈上升态势。美国和中国在地球大数据研究领域处于领先地位,且目前中国的年发文量已经超过美国,但高被引论文数量低于美国,论文质量发展提升空间较大。从全球地球大数据发文最多和论文总被引频次来看,研究热度较高的机构不一定是影响力较大的机构。受我国地球大数据工程项目牵引,我国近 3 年的地球大数据发文量和影响力均得到快速提升,已经跃居全球第一,并且由我国科学家发起的基于地球大数据的“数字丝路”国际科学计划带动,与“一带一路”多个国家和国际组织合作,参与国家科研机构在地球大数据的科研产出上也得到明显的发展。地球大数据发文所属期刊来看,中国期刊的国际化与国际影响力仍有待提高,国际合作以华人居多,需要进一步深入拓展。地球大数据研究领域主要分布在遥感科学、环境科学、大气科学等,其研究热点也主要聚焦在地球科学的研究热点主题上,以应用为主,理论方法主要涉及与信息技术相关的人工智能等。

 

尽管国内外地球科学大数据都已经形成了相当的规模,取得了可观的应用成果,但从发表的地球大数据相关研究论文内容来看,仍然存在诸多问题亟待解决,如:缺乏统一的数据描述标准、规范的数据共享机制,以及数据融合与深度挖掘问题显著和地球系统模拟预测精度不高等。未来地球大数据的重点研究方向主要集中在:跨学科的地球大数据共享与融合;构建地球科学大数据深度挖掘理论与方法;建设地球大数据智慧平台;形成新的研究范式与协同研究模式。(作者:安培浚、李佳蕾,中国科学院西北生态环境资源研究院、中国科学院大学;肖仙,桃中国科学院西北生态环境资源研究院;郭华东、闫冬梅中国科学院空天信息创新研究院。《中国科学院院刊》供稿)。


返回顶部