通过微软官方博客了解到,微软 Azure 云计算部门营销人员 Kevin Raines 在官方博客表示,在 5 年前的微软 Ignite 大会上,微软对外宣布了全球基于云平台的 AI 超级计算机,并在 2020 年 5 月召开的 Build 2020 开发者大会上,再次宣布和 OpenAI 合作共同创建了一台可以与当时世界五大超级计算机媲美的超级计算机,并且至今微软都在尝试不断挑战极限。
而在 2021 年微软 Azure 云服务平台将公共云服务提升到了一个新的高度并对外展示了公开的 AI 超级计算机,在 2021 年 6 月份的超算 TOP 500 榜单中获得了从第 26 位到第 29 位连续四个位置,这些超级计算机集群是 ND A100 v4 系列的一部分,且每个登上超算 TOP 500 排名的微软超级计算机的 HPL 基准上都达到了 16.59 PetaFLOPS。而在近期“Supercomputing 21”公布的最新超算 TOP 500 榜单中,微软 Azure 云平台的 NDm A100 v4 Public AI 超算以 30.05 PetaFLOPS 的成绩成功加入了 TOP 10 的行列。
英伟达公司副总裁兼加速计算部们总经理 Ian Buck 对此表示:“高性能计算和人工智能的融合将会是一场革命,为每一种模拟都提供了明显的加速效果,推动了整个科学和工业领域的发展。”微软 Azure 云平台超算 NDm A100 v4 的实例展现了 NVIDIA GPU 加速功能以及 NVIDIA InfiniBand 网络的实力,可使研究人员更快发现新内容并推动科学的发展。
微软 NDm A100 v4 Public AI 超算搭载八个英伟达 A100 Tensor Core GPU,每个 GPU 拥有 432 个英伟达 Tensor Core 以及 6912 个英伟达 CUDA Core,每块 GPU 都支持 HDR 200G InfiniBand 连接,可为 Azure 云中数千个 GPU 之间建立快速连接。