IT采购网8月31日消息,谷歌云在今天召开的云Next大会上宣布,将于下个月推出A3虚拟机实例。这款新虚拟机实例的最大亮点是配备了英伟达H100Tensor Core GPU,可以满足生成式人工智能和大语言模型等需求。
据介绍,A3实例采用了第4代英特尔至强可扩展处理器、2TB DDR5-4800内存,以及8张英伟达H100“Hopper”GPU。通过NVlink4.0和NVSwitch,该实例实现了3.6TBps的对分带宽。新的A3超级计算机专门用于训练和服务要求最苛刻的人工智能模型,并为生成人工智能和大型语言模型创新提供支持。据称,该超级计算机可以提供26exaFlops的人工智能性能。
此外,谷歌云还在发布会上介绍了全新的TPUv5e,这是迄今为止成本效益和可访问性最高的云TPU。这些TPU或定制ASIC旨在加速人工智能和机器学习工作负载。根据SDxCentral的报道,TPUv5e相较于前代,每美元的训练性能提高了一倍,每美元的推理性能提高了2.5倍。