发展AI网络面临的四个关键技术
AI大模型时代,大模型参数量和训练集规模大幅增加,仅靠GPU芯片单体算力的提升已经不能满足需求,业界目光正从单体算力转向了系统架构层面的创新。其中,底层核心技术网络,成为关键突破口,全球各大公司纷纷进行相关产品技术的研发。AI网络技术的角逐正在展...
Meta 构建分布式 RoCEv2 网络:探索串联数万片 GPU 训练 AI
IT之家 8 月 7 日消息,Meta 公司于 8 月 5 日发布博文,表示为了满足大规模分布式 AI 训练对网络的需求,构建了基于 RoCEv2 协议的大规模 AI 网络。 RoCEv2 的全称是 RDMA Over Converged Ethernet version 2,是一种节点间通信传输方式,用于大部分人工智...
网络也有AI加持,高通推出A7 Elite无线联网平台
随着芯片平台能力不断增长,AI 的能力也逐渐进入到各方各面,比如在路由器的无线联网平台,此前就有厂商为芯片增加了 NPU,提供了一部分的 AI 算力。最近,高通也带来了全新的平台,名为 networking pro platform A7 Elite。 这款平台采用了四核设计的 CPU,...