联系我们

综述: 从地球科学和高性能计算看年轻人的挑战和机会

2020-11-04

DavidA.Yuen是美国哥伦比亚大学教授、美国地球物理学会会士(AGUFellow)、国际计算地球动力学权威,一直非常关心青年HPC人才的培养。

近日,他联合五位地球科学学者发表了一篇论文《在新信息技术时代地球科学需要加强基于高性能计算和大数据的科学研究》(ps:为方便读者阅读,公众号标题在论文标题基础上做了调整),研究新信息时代对地球科学领域研究人员尤其是年轻人的影响。新信息时代,年轻人的工作前景、职业发展产生哪些改变?面对可视化、深度学习、量子计算、云计算等热门领域,又该如何选择?文章对这些问题进行了详细讨论。

ASC超算竞赛官微授权转载此文,以期对青年学生的职业选择提供一些启发和思路。


论文作者

HenryM.Tufo1,DavidA.Yuen2,3.,GabrieleMorra4.,MatthewG.Knepley5,张贝6,陈石6

1.Dept.ofComputerScience,UniversityofColorado,Boulder,U.S.A.

2.Dept.ofAppliedPhysicsandAppliedMathematics,ColumbiaUniversity,U.S.A

3.CollegeofInformationScienceandEngineeringandCollegeofMarineGeosciences,OceanUniversityofChina,Qingdao,China

4.Dept.ofPhysicsandEarthSciences,UniversityofLouisiana,Lafayette,LouisianaU.S.A

5.Dept.ofComputerScienceandEngineering,StateUniversityofNewYork,Buffalo,U.S.A.

6.InstituteofGeophysics,ChinaEarthquakeAdministration,Beijing,China


摘要

我们阐述了2020年新信息时代对地球科学领域研究人员尤其是对年轻人的影响,并倡导和呼吁他们对职业培训和发展进行重新思考。本文展望它在未来十年对学术生涯规划和更现实的职业目标的潜在影响。我们敦促职业中期的人们需要重新评估以前的职业规划。学生或研究人员需要具备高性能计算(HPC)、数据分析、人工智能和/或可视化方面的技术,以及应用计算机科学和数学方面的广泛技能。我们就几个在未来十年有巨大发展潜力的领域的热门前景给出建议,比如可视化、深度学习、量子计算和信息以及云计算,所有这些都属于高性能计算的范畴。我们的预测是,新信息时代将大大改变各年龄段研究人员的工作前景和职业道路,我们在地球科学中年轻学者未来所面临的严峻局面进行了深层探讨。


01当今地球科学年轻科研人员所面临的问题

新信息科技时代的形势对就业市场和科学技术市场上的年轻研究人员产生了巨大的冲击。不仅2035岁的年轻人会受到影响,而且年龄在3550岁的中年人将会感受到技术变革的冲击。各个年龄段的人都会感受到这种影响,甚至包括那些即将退休的人。

现在的高速发展的全球经济以及美国教育产业的自负盈亏的产业模式对美国大学产生特别的影响,因为它们的商业模式侧重于吸引富裕的国内外学生。有能力、有抱负的学生对地球动力学等固体地球科学理论学科缺乏兴趣,入学人数一直都在减少。在过去的30年里,还有美国教育界的一种趋势是降低数学和物理科学课程的数量,以吸引更多的学生学习地球科学。这导致了一些美国国内研究生知识储备不足,同样的情况也发生在欧洲的本科课程中。这种衰退将严重影响美国各州和国家层面的研究支持。这将意味着,除了人工智能和量子计算与信息等特定战略领域外,所有支持研究生的职位都将减少。我们预计在不久的将来,美国的联邦机构如国家科学基金会、美国地质勘探局、美国国家航空航天局和美国能源部等在地球物理学或地质学等大多数领域都会削减开支。这种情况在欧洲不会那么严重,但在北美和澳大利亚,我们预计这些领域的研究生入学人数会下降。自1960年代以来,地震波传播的数值模拟一直是地球科学高性能计算的主要驱动力。70年代末,地幔对流的高性能计算才出现。在过去的几年里,我们可以确切地看到,潮流已经发生了变化,地球科学中的数值建模如今已落入数据分析、反问题、不确定性量化和深度学习等更大的范畴。固体地球地球物理学已经达到了全盛时期,未来我们不会过多地关注传统的固体地球地球物理学的建模,例如孔隙波或火山喷发、冰川后反弹和俯冲过程这些方向的研究。在美国,由于美国国家科学基金会的地球科学计划,在过去的二十多年里,俯冲动力学一直是地球动力学模型的主要驱动力之一。在中国和日本、德国等其他国家,对俯冲过程没有这样的特别关注。然而,地震波通过不均匀介质的传播上比俯冲动力学对社会更有实际的应用意义。波成像一般在很多其他实用科学和工程都有应用,特别是在生物医学领域有广泛的应用。

1地球科学研究方向从1985年至2020年的转变


21世纪20年代,固体地球地球物理学在美国学术界的总体规划中变得越来越不重要。相反,其他学科,如大气、海洋、气候建模、太阳物理学、磁重联和太阳耀斑建模正引领着这一方向,因为这些现象具有更多的社会影响(见图1)。在21世纪,尤其气候变化、海啸和飓风更和人们息息相关,它们的研究更有科技与实际经济指导价值。它们应该比沿着圣安地列斯断层或美国西北部的卡斯卡迪亚俯冲板块的大地震、四川盆地的地震灾害或北京周边地区的地震风险得到更多的关注。

所有这些迫在眉睫的变化将意味着我们必须超越大学里单一学科领域发展的世界观。让我们多走跨学科的路,把地球科学和其他学科联系起来。我们不能再仅仅使用《科学》或《自然》,或在《地球物理研究杂志》或《流体力学杂志》等顶级期刊上发表的论文数量来判断一个人在计算地球物理领域的成就。这些传统的比较方法用于量化以前大学的相对地位。在今后的时代,生产有用的工件(例如,软件)也应该得到奖励。

如今对研究生来说更重要的是重新适应新形势,并学习高性能计算相关技术,以便在后疫情时代的新工作机会中找到有收入的工作,因为今后找到学术职位将变得困难。

确实有许多可供学习的资源来完成这一转变。如PETScGeoClaw等软件库,还有其他一些交付到社区的软件,如矿物物理研究中使用的VLAB,用以全球地球动力学模拟的ASPECT,用于地壳动力学的PyLith。在可视化软件方面,人们转向LavaVuUnderworld来模拟各种地球物理问题和火山流,这项工作由澳大利亚政府资助了17年多,由LouisN.Moresi领导,当时他在墨尔本莫纳什大学工作,并与莫纳什大学的SteveQuenetteOwenKaluza合作。我们必须培养能在大流行后的世界中从事各种行业的学生。训练学生使用GPU对研究和就业都是一个好主意。GPU现在已经是成熟的技术。

美国的学术任期问题也被提出(Htun,2020)。是维持传统的终身制?还是会转向像职业体育那样的合同模式,五年或十年的合同?或者,我们是否会采用美国医学院的模式,支付基本工资,高于基本工资的部分必须由计算科学或地球物理学教授主动提出(例如,额外津贴)。在过去的几年里,同样的关于终身职位的问题在中国科学院已经被提出,那里很少有人有终身职位,大多数是领导职位。终身教职是留住人才的一种手段,但这种模式下的人们在转向新的研究方向时有很多犹豫,因为太多的地球动力学家和地震学家囿于已有的成绩和知识结构,不愿在新的角色中重塑自己。


02改变已经在进行

2012年以来,大数据已经显著地进入了我们的社会(Lohr2012;Mayer-SchönbergerandCukier2013)。这是一个发展速度非常快的领域,因为大数据在商业、医学和科学方面都有广泛应用,大数据研究经历了高速发展。直到最近(Bergenatal.2019),地球科学家在地球领域科学研究在大数据研究方面一直进展缓慢(Bergenatal.2019),包括几年前流行的一些研究的计算算法很快就过时了。这里我们要强调的是,三年前学习的机器学习,如现在地学领域还在使用的HadoopPython,PyTorch,Keras等在工业界找工作的时候已经是过时了。但是对于那些仍然在使用这些数学模型的练习的学者来说,还是有机会的。只是我们会再次强调地球物理各种不同研究方向的数学模型的综合,如使用卫星数据研究冰期后回弹,不仅需要了解基本的数学知识,也要了解机器学习最新发展(Vadapalli2020;vonRuedenetal.2020;Bergenetal.2019;Morraetal.2021(inpress))

其次,我们将在这里强调,我们应该在HPC中加入一个更加平衡实际应用和理论研究的和数值方法的教育包。包括用于建模、数据分析和数据同化的云计算资源(Huang,DongarraFox,2012)。我们必须强调加强大规模的,大数据量的即时数据的快速传输和远程云存储需要,比如地幔对流机器学习中使用的数值模拟视频(Shahnas,2018))X射线和中子束的实验图像流。

三是我们也支持加强在职培训。涉及虚拟化的大型实验就是一个很好的例子。我们鼓励用户使用例如NCARCSEM用于参数搜索,或其他软件如ASPECT,Pylith(CIG产品)Underworld(Australianproduct)LavaVu(多尺度现象的可视化工具,这是由澳大利亚SteveQuenette在莫纳什大学开发的)。澳大利亚政府支持LavaVu这个项目已有17年多。因此,我们希望各国政府能够理解软件开发需要较长的时间,这包括软件开发长时间开发周期和长时间软件应用维护。我们也需要研究设计出一种工作软件能够利用人工智能方法可以自动修正输入参数,可以优化工作流程。例如,为特定的工业过程设计工作流程的智能代理,如飞机或医药产品的设计。我们相信,这类技能能够让学生在不同行业找到适合自己的岗位。

现在流行的在线远程交流在地学领域研究中也存在各种问题。我们看到了在线远程交流方面的种种问题。人们使用WebExZoom等类似的通信工具进行日常语音和视频交流,但在大数据交互式可视化方面却没有太多可用的工具。交互式可视化是24年前由麻省理工学院的BobHaimesIBMKirkE.Jordan首创的(Jordanetal.1996)。我们需要可视化专家来继续这一工作,因为在演示和教学中可视化太有用了,尤其是今天5G手机和边缘计算、云计算技术的发展,完全具备了交互式可视化实现的软硬件条件。如前所述,科学数据或各种演化现象的可视化(如金融、地球物理或全球灾难事件),是另一个很好的就业领域。

很多地球科学中的物理模型需要通过实际数据验证而进行进行模型优化,以找到更好的的数据模型参数。因此,我们必须解数据反演问题的非确定性Tenorio,2018Aster等,2018)。在解决这些数据反演问题时需要地球科学专业的学生熟悉高性能HPC对处理复杂的大数据以及大数据反演问题所涉及的软件的基础架构以及各种算法。因此,地球科学专业的学生学习一些现有的、已经可以使用的各种软件平台和计算引擎的知识,以及可以使用其平台的脚本语言进行多线程和多GPU的并行计算工具。他们应该知道如何通过使用HPC、数据云和源程序解决地球科学之外的各种实际问题的大规模建模现成的流程。比如我们在处理大型分布式数据时可以应用机器学习算法,尤其是大型计算机的深度神经网络,这和处理小规模数据具有根本的不同。


03未来的科学计算的发展

云计算已经存在很长时间,并且已经成熟,而且是未来计算平台发展趋势。开放堆栈模式下的云计算对于处理多种环境的事务也很重要:市政、区域、国家和全球环境。当今,由于Zoom、亚马逊和微软的努力,云计算领域变得更加突出。云计算表明,现在它可以在高性能计算和数据分析中发挥重要作用。人们现在很欣赏它存储大数据集的能力,这在大学或NSF中心是不容易得到的。

量子计算(QC)和量子信息在过去几年它们一直是热门话题,因为QC在速度和内存容量方面可以在许多学科中取代传统计算(NielsenandChuang2010)。量子计算,特别是量子机器学习算法,可以在不久的将来比今天人们想象的更早地解决实际问题,现在人们对量子计算和信息的兴趣非常浓厚。为了吸引优秀学生的注意,即使是在高中,也应该向年轻人传授一些基本而扎实的量子计算知识,当然在本科阶段也应该如此。几年之后,他们应该会顺利地掌握编码技能,以便利用量子计算解决深度学习问题或进行材料特性建模。

另外量子计算QC和量子信息对未来大学教育以及科研研究方向产生很大的影响。可以肯定的是,世界各地都有新的资金投入到QC中。在美国的四个NSF中心和能源部中心都将有量子计算的教育部分,甚至到了本科水平。量子计算和量子信息正在兴起(NationalAcademyofScience,2019,2020)。社会各阶层都对这一现象产生了浓厚的兴趣,就像淘金热一样,未来十年将掀起一场量子计算和量子信息运动。在过去很多年,美国政府按部就班的计划推进网络基础设施建设(Baderetal,2018Dunningetal.2018),但最近这一动力转向了人工智能、量子计算和信息。我们已经看到量子计算和量子信息对教育的影响,新的投资无处不在。美国的NSF中心都将在本科阶段开设量子计算课程。


04讨论

在不久的将来,我们能看到美国和中国的年轻地球科学研究学者们将面临什么?两国都在量子计算和云计算领域全速前进。这些领域——包括基于云平台的计算、量子计算和量子信息。年轻的地球物理学家们可以考虑不用继续在学术领域发展,而是学习重新塑造自己,成为研究波动现象或可视化的量子计算程序员。其他人可以进入GPU计算领域,这些领域还有很长的路要走。现在有许多由美国国家科学基金会和能源部慷慨资助的长期多学科项目,旨在为与人工智能相关的量子计算和信息科学培养科学技术人才。在中国,我们预计类似的趋势很快就会发生。

我们预测到2025年量子计算将和深度学习(Beeretal.2020)结合。年轻的研究人员应该在云计算、大数据和深度学习,以及量子计算和量子信息不同研究方向链接以及研究途径有深度的理解(见图2)。量子计算是这些方向中比较艰难的一个环节。我们应该将这些新信息计算方向整合在一起,在对社会有用的新技术领域培养新的科技研究人员,而不仅仅是写论文证明这些NSFDOE作为美国科学研发中心的伟大名声的而存在。

综上所述,我们对地球科学领域的研究人员有如下建议:

1.至少在未来5年,年轻人要想获得学术职位将会很困难。这在任何党派政府领导下的美国都将是如此,在澳大利亚、加拿大和欧洲等西方国家也是如此。然而,学术研究在中国有一个更光明的未来,因为它的教育投资理念是长期的。另外,即使你能够获得终身教职,终身教职和终身工作的概念也在迅速消失。这种稳定的教职制度本身是用来平衡低收入的教授职位和稳定工作之间的关系,既包括终身教职较低的薪水,也包括读研、读博,以及甚至那些不得不做博士后而失去的在其他领域的工作机会,直到出现一个教职空缺的长期等待时间。

2.在大数据时代,传统的直接计算方程数值模拟已经过时,这个情况和十年前那种流行的研究方法有很大的不同。但是研究者还是可以在学术界之外找到传统的数值模拟工作。

2新信息科技时代高性能计算的远景

3.对于想继续在科学和技术领域继续工作的年轻研究者来说,高性能计算工作是一个相对很好的从事研究方向。在高性能计算研究方向中有很多机会,其中包括:(a)基于GPU编程的云计算的一个成熟研究方向。(b)虚拟现实可视化和增强现实可视化算法和技术也日益成熟,特别是在地质领域,未来的杀手级应用将是增强现实(c)量子计算和量子信息在在不远的将来,到2028年左右,也将是很成熟的研究以及应用方向。年轻学者最好能意识到这一点,并为它做好准备。

4.其他,下面各项不分先后。

a.在大多数情况下由个人编写的软件所展示的实际应用应被更多的考虑,在评估研究人员的贡献和实际能力方面比论文更重要。

b.大学的单一学科组织和发展(系、研究所和学院)不利于基于多学科多领域协作研究的资金和项目的发展。

c.当今很多研究都需要一流的高性能网络基础设施的支持。但实际上这个在实际研究中很多还是基于本地计算机上。

d.当前的复杂的全球经济和政治形势将使无国界的科研合作变得很艰难。

e.很多美国政府主导的科研资助机构已经不能很好地领导学术研究了。资金的缺乏(除了国立卫生研究院)以及缺乏有效的政府机构的研究管理机制是主要问题;

f.美国政府在研发方面投入逐年减少,学术研究难以持续。同时很多工业界的基础研发预算也被减少,更多的研究转向能带来短期利益的工业产品开发。过去那些伟大的实验室,贝尔实验室,IBM沃森实验室,埃克森研究公司等,都只是过去的影子。最近几年谷歌、微软、FACEBOOK等公司也转向了能更实用的能带来经济效益的研究。


05致谢

我们感谢WitekDzwinel,WimSpakman,SteveQuenetYingchunLiuDannyLoegering的讨论,感谢ArthurZhongYingchunLiu的文章修改和图片制作。这项研究得到了美国国家科学基金会(NSF)和美国能源部(DOE)的资助,资助对象为HenryM.TufoDavidA.Yuen,和MatthewG.Knepley


参考文献

1.Bader,D.A.,G.Tech,H.M.Berman,M.Parashar,T.H.Dunning,G.Jacobs,T.Agerwala,M.Hildreth,R.Loft,andS.Ruggles,“CI2030:FutureAdvancedCyberinfrastructureAreportoftheNSFAdvisoryCommitteeforCyberinfrastructureTransmittalletterfromtheNSFOfficeofAdvancedCyberinfrastructureReportCI2030:FutureAdvancedCyberinfrastructureNSFAdvisoryCommitteeforCyberinfrastructure1CyberinfrastructureEcosystemWorkingGroup,”Tech.Rep.,2018.[Online].

Available:https://www.nsf.gov/cise/oac/ci2030/.

2.Beer,K.,Bodarenko,D.etal.,TrainingDeepQuantumNeuralNetworks,NatureCommunications,11,articleNumber8,2020

3.Bergen,K.Johnson,P.A.,DeHoop,M.V.andG.Beroza,Machinelearningfordata-drivendiscoveryinsolid-earthgeosciences,Science,363,20194.Dongarra,J.,Getov,V.andK.Walsh,Bringingthefuturecloser-SupercomputingHistoryandtheImmortalityofNow,IEEESociety,Society,October20185.Dunning,ThomH.,ChairJr.,GwenJacobs,TilakAgerwala,DavidA.Bader,HelenM.Berman,MichaelHildreth,RichLoft,andStevenRuggles.2018.“CI2030:FutureAdvancedCyberinfrastructure,AReportoftheNSFAdvisoryCommitteeforCyberinfrastructure.”https://www.nsf.gov/cise/oac/ci2030/ACCI_CI2030Report_Approved_Pub.pdf.6.Easter,R.C.,Borchers,B.andC.H.Thurber,ParameterEstimationandInverseProblems,SecondEdition,450pp.,20137.Htun,M.,TenureandPromotionafterthePandemic,Science,vol.368,issue6495,pp1075,DOI:10.1126/science.abc7469,20208.Huang,K.,Dongarra,J.andG.C.Fox,DistributedandCloudComputing,578ppMorganandKaufmann,20139.Jordan,K.E.,D.A.Yuen,D.M.Reuteler,S.ZhangandR.Haimes,ParallelInteractiveVisualizationof3DMantleConvection,IEEEComputationalScienceandEngineering,Vol.3,29-37,1996.10.Nielsen,M.A.andI.L.Chuang,QuantumComputationandQuantumInformation,CambridgeUniversityPress,201011.QuantumComputing,ProgressandProspects,NationalAcademyofSciences,201912.Shahnas,H.,Yuen,D.A.,R.,Pysklewec,InverseProblemsinGeodynamicsUsingMachineLearningAlgorithmsJ.GeophysRes.,Vol,123,https://doi.org/10.1002/2017JB014846,201813.Tenorio,L.,AnIntroductiontoDataAnalysisandUncertaintyQuantificationforInverseProblems,265pp,SIAMPress,2017


(转载自ASC超算)

诚聘英才
友好链接
业务咨询及参观访问:0755-86576085    0755-86576086    地址:深圳市南山区笃学路9号
国家超级计算深圳中心(深圳云计算中心)  ©2014-2020  粤ICP备10220126号