基于分布式并行的代数多重网格算法库。
随着E级计算的到来,HPC系统的节点数量可以达到十万以上。对于使用了通信密集型程序而言,全局的聚合通信很可能成为严峻的通信瓶颈,从而制约通信性能。阿贡国家实验室的研究人员对Mira/Cetus超算系统的MPI实际使用情况进行了追踪,涉及两年内运行的约十万作业,提供了实际生产环境中科学计算应用对MPI使用特点的观察与分析:1) 应用运行过程中花在MPI库中的执行时间要长于预期,相当多的应用超过一半的执行时间花在MPI中。2) MPI聚合通信的使用显著多于点到点操作,而少数的由点到点通信主导的应用则以结构化最近邻居通信模式为主,可由MPI邻居聚合通信取代。3) 多线程应用需求高于预期,约30%的应用依赖MPI的多线程支持。4) 虽然小消息(不超过256字节)归约操作是利用最多的MPI通信,有将近20%的作业利用到大消息(超过512KB)归约。可见,聚合通信是今后MPI优化的重点。
高保真仿真的需求日益增强,从而开发高精度高并发高可扩展的输运软件迫在眉睫。 YH-OpenSN是一款基于多群离散纵标法的可靠易用性软件中子输运仿真软件,针对银河天河体系进行高度优化的高并发高可扩展性的并行软件。目前,它能够求解有效增值系数问题以及次临界倍增因子问题,支持二维和三维的直角坐标系和圆柱坐标系,支持规则网格且兼容TORT的非规则网格,几乎包含所有常用差分格式,负源修正策略以及加速策略。它既能够兼容TORT的输入卡片,也能够采用几何构建(CSG)的方式进行建模。
拓扑映射方法被认为是优化高性能计算机上通信性能的有效解决方案。通过优化进程到空闲计算资源的映射可以提高数据的局部性,例如,合理的映射使得互相通信的进程被映射到物理距离相近的处理器上,这样能使大部分通信都集中在同一机框或机柜中,减少了长距离通信,从而使得高性能计算机的通信性能得以优化。
网格质量判别可用于优化航空航天工程应用领域中数值计算的准确性问题,是高质量网格生成技术的重要技术手段,也是计算流体力学(CFD)研究的难点。目前网格质量的判别优化过程无法摆脱人工参与,已知的商业网格软件和网格生成技术都不能自动地筛选高质量的计算网格,这成为了制约网格自动化处理流程发展的瓶颈。本课题组拟使用深度学习方法,以实现智能化、自动化网格质量判别为目标,以构建网格质量数据库,训练对网格质量进行判断识别的深度学习网络模型,开发网格质量智能检测模块等关键步骤为主线,研究基于人工智能的网格质量检测及网格优化调整新方法。项目研究工作能为国家数值风洞网格软件的自动化检测功能提供技术支撑,对提高网格质量判别效率,缩短网格生成周期,完善全自动网格生成、检测、调优的迭代闭环有重要应用价值。
YH-Sn3D是另一款着重与异构加速方面的粒子输运软件,主要基于类KBA算法,实现了CPU和Matrix-2000的异构并行算法。YH-Sn3D通在 CPU 和 Matrix-2000 加速器之间采用 ACL 和 BCL 进行控制和通信,实现异构编程;根据处理器核的计算能力进行任务划分。在 Matrix-2000 加速器端,通过 OpenMP 指令开发程序的线程级并行;测试结果表明 OpenMP线程级优化最大可以获得 5.5 倍的加速;在天河二号升级系统上进行测试,大规模扩展达到101 万核,对比 17 万核并行效率达到 52%
Contributions last year: 0
Max continuous contributions: 0
Recent contributions: 0
Commits, issues, and pull requests will appear on your contribution graph. Only when the email address used for the commits in local configuration is associated with your GitOSC account, the commits' contribution will be counted.