新闻
2025-04-04 09:48 点击次数:65

群众AI的顶级嘉会GTC于3月17日到3月21日在好意思国硅谷汜博举行。在GTC大会时代,华瑞指数云ExponTechCTO曹羽中受邀过问了专注于AIStorage的技巧研讨会并发饰演讲。在演讲中,曹羽中先容了ExponTech与互助伙伴ScaleFlux,AIC基于英伟达的BlueField3DPU以及英伟达最新发布的Spectrum-X汇集打造的新式AIStorage有筹备,展示了该有筹备的本色测试数据,并与互助伙伴,AIStorage行业众人以及一些大型客户进行了长远究诘。与会的众人均默示该有筹备的实测性能数据以及概括上风发扬远超预期,具备很高的交易价值体育游戏app平台,veryimpressive!
新式AI存储有筹备接受的软硬件有筹备:
硬件:
F2026 AI就业器,是一台2U闪存JBOF,配备2个或4个NVIDIA BlueField-3数据处理单位(DPU)和24块高性能ScaleFlux CSD5000 NVMe SSD(CSD5000是ScaleFlux公司最新推出的一款内置硬件压缩与解压缩能力的高性能NVMe SSD介质);
NVIDIA Spectrum-X汇集交换机;
软件:
华瑞指数云ExponTech下一代散播式存储软件平台WADP (WiDE AI Data Platform);
(本有筹备接受的2U存储节点及ScaleFluxCSD5000 NVMe SSD)
基于此有筹备的AI磨砺和推理环境的实测部署架构如下图:
1台2U AIC JBOF当作存储就业器, 配备4块NVIDIA BlueField3 DPU, 提供1600Gbps汇集带宽,24块ScaleFlux CSD5000 NVMe SSD,ExponTech WADP存储软件的后端开动于BlueField3 DPU内;
1 台门径2U就业器当作筹备就业器,配备4块NVIDIA BlueField3 DPU,提供800Gbps汇集带宽,在DPU里面开动ExponTech WADP存储软件的存储网关和公约;
筹备就业器上不错成立GPU,用于磨砺或推理,存储软件和汇集流量开动于DPU内,存储IO不会虚耗筹备就业器的CPU和内存资源,筹备就业器不错领有更充沛的资源用于筹备处理;
测试环境非凡聘用了4台NVIDIA Spectrum-X交换机组成两层汇集,主淌若为了模拟与考据在大界限组网的情况下,RoCE汇集是否依然不错很好的处理拥塞,存储软件不错依然保合手踏实的存储性能和低时延;
存储就业器(JBOF)和筹备就业器均不错按需沉寂膨胀,按需加入更多的存储就业器(JBOF)或者筹备就业器,组成大界限的,存算永诀的,按需膨胀的AI磨砺和推理集群。
基础存储性能考据:
基于上一节所述的实测部署环境,进行了存储系统的基础性能考据,其考据方式是从筹备节点上开动FIO,测试存储系统的基础性能筹备。
单个筹备节点不错达到近90GB/s的存储带宽,接近筹备节点网卡的物理带宽上限;
单个筹备节点不错达到310万IOPS,当成立更多的筹备节点时,不错同步得回更多的IOPS。探讨到通盘存储系统的后端以及公约端齐是跑在DPU内,DPU内的CPU处感性能远远不如就业器成立的CPU,单个筹备节点+单个存储节点即达到310万IOPS照旧充分展现了本有筹备格外惊东说念主的IO处理驱散;
存储系统的IOPS与存储节点上部署的数据处理单位(DPU)数目呈线性比例膨胀,系统的IOPS随DPU部署数目线性膨胀,标明其具备极佳的横向膨胀能力。本有筹备接受的存储节点最多不错成立8张DPU(现时测试环境成立4张),还不错达成IOPS性能翻倍以及汇集带宽翻倍;
存储系统在使用小IO size时,并发大压力时延低至266us, 在使用大IO size时,打满筹备节点的汇集物理带宽,时延还能永恒保合手在1毫秒以下。
MLPerfStorage v1.0测试驱散:
MLPerf™是影响力最广的国外AI性能基准评测,MLPerf™Storage是针对AIStorage的基准性能测试,不错较为全面的评估测试AI应用关节的存储需求。MLPerf™Storage基准测试通过开动一个散播式磨砺测试关节,模拟GPU筹备经过,在此经过中真的的实行AI就业器对存储系统的读写窥察,以此来测试存储系统约略复古的最大GPU数目和带宽发扬。
MLPerfStoragev1.0于2024年8月推出,国表里一共有十三家从事高性能存储研发的厂家参与了测试并提交负责测试驱散,其中包括DDN(Lustre),华为,WekaIO,Hammerspace等闻明的散播式文献系统厂家。
本次咱们聘用了ResNet50模子(主要用于图像分类和图像识别场景),在上述1存储节点(JBOF)+1筹备节点的测试环境上进行了MLPerfStorage v1.0基准测试,测试的驱散如下:
测试驱散标明:
ExponTech的新式AI存储有筹备具备群众当先的性能,单客户端约略支合手的GPU卡的数目越过了所有参与了MLPerf Storage v1.0负责测试的厂商,位居群众第一;单客户端约略达成的存储带宽达到近30GB/s, 位居群众第二;
本次测试环境唯唯一个客户端节点(筹备节点),CPU和内存成立较低,在开动MLPerf Storage v1.0的测试中照旧达到了客户端节点的筹备能力的瓶颈,然则还远远莫得达到存储节点的存储能力的瓶颈。如果换用处理能力更强的筹备节点来作念测试,不错测试出更高的性能数据,即支合手更多的GPU卡,达成更高的存储带宽。
回来
基于本次在真的的环境上的全面测试,回来一下ExponTech与互助伙伴ScaleFlux,AIC基于英伟达的BlueField3DPU以及英伟达最新发布的Spectrum-X汇集打造的新式AIStorage有筹备的环节特质和上风:
全国顶级性能,SPC-1 评测卓越所有高端全闪存储阵列,冲突全国记录,MLPerf Storage v1.0测试数据大幅度卓越WekaIO, DDN等闻明并行文献系统;
全国顶级容量密度,现时每2U Storage Node可达成越过1.6PB存储裸容量,来岁可膨胀至每2U越过6.6PB,最大化数据中心空间的AI数据价值;
成立的ScaleFlux CSD5000 NVMe SSD具有盘内透明压缩解压缩能力,约略在不虚耗额外系统资源,不影响性能的情况下达成有储裸容量的数倍放大,存储容量驱散得回惊东说念主的晋升;
团结平台上同期支合手高性能散播式块存储和文献存储等多种公约,除了支合手AI的磨砺和推理场景,还不错粉饰数据汇集,数据准备,RAG等AI Pipeline全场景,无用为AI Pipeline成立不同的存储有筹备以及反复进行数据拷贝迁移,不错达成AI算力和存力的彻底存算永诀和沉寂膨胀,具备更好的可处分性和驱散;
庞杂的并行膨胀性,存储节点及筹备节点均不错沉寂的水平膨胀,同期达成有储性能和容量的等比例膨胀;
可靠性高,可人慕性高,存储节点接受比较门径就业器更为精简的JBOF,硬件故障率更低,同期JBOF里面接受冗余的硬件想象来保险可靠性,晋升可人慕性;
支合手基于RoCE的超大界限组网,接受RoCE动态路由和细粒度的负载平衡达成更好的拥塞汗漫,基于门径以太网在大界限RDMA组网中达成高效带宽, 低抖动和超低时延;
优化的总体领有资本(TCO),高密度的存储节点+透明盘内压缩+新式软件界说存储软件的组合简化了硬件资本,大幅度晋升了存储空间讹诈驱散和读写性能,简化了处分,AI客户将因此大幅度优化其AI Storage的总体领有资本(TCO);
基于此有筹备的KV Cache大界限合手久化有筹备也行将推出,达成AI推理集群内的K,V向量的全局分享体育游戏app平台,约略以低资本高性能的大界限存储能力替代AI推理经过中K,V向量的广阔肖似运算,达成AI推理算力资本的大幅裁汰。
声明:新浪网独家稿件,未经授权不容转载。 -->Powered by Kaiyun网页版·「中国」开云官方网站 登录入口 @2013-2022 RSS地图 HTML地图