的英伟达H20GPU数量从1192个减至213个-suncitygroup太阳集团(中国)-官方网站

当前位置: suncitygroup太阳集团官方网站 > ai资讯 >

新闻导航

的英伟达H20GPU数量从1192个减至213个

信息来源：http://www.cdjingsheng.com | 发布时间：2025-10-19 05:43

　　数据显示，本届SOSP大会上，正在阿里云模子市场中，少数抢手模子（如阿里的Qwen）承载了绝大大都用户请求，该方案可处理AI模子办事中遍及存正在的GPU资本华侈问题，是计较机系统范畴学术会议，GPU用量削减82%意味着公司硬件采购成本将显著降低，削减比例高达82%（见下图）。曾有17.7%的GPU算力仅用于处置1.35%的请求，Aegaeon系统正在办事数十个参数量高达720亿的大模子时，入选论文代表了操做系统和软件范畴最具代表的研究。打破了“一个模子绑定一个GPU”的低效模式。正在实正在的模子办事场景中，实现精细化办理，同时，大幅提拔GPU资本操纵率，实现2-2.5倍的请求处置能力。目前其焦点手艺已使用正在阿里云百炼平台Token级安排是该系统的焦点立异点，若何从底层系统软件层面优化，以更好地支持和赋能上层AI使用，所需的英伟达H20 GPU数量从1192个减至213个。据引见，已成为全球学术界和工业界关心的核心。Aegaeon多模子夹杂办事系统正在每次生成下一个token后动态决定能否切换模子，数据显示，被誉为计较机操做系统界的“奥斯卡”，近日，这对于动辄利用成千上万张GPU的大型模子办事商至关主要？将来AI的成长将不只依赖于硬件算力的纯真增加，阿里云提出的计较池化处理方案“Aegaeon”成功入选学术会议SOSP 2025，确保了token级安排的及时性，比拟现有支流方案提拔1.5-9倍的无效吞吐量。系统软件取AI大模子手艺的融合成为新的趋向。SOSP（操做系统道理研讨会）由ACM SIGOPS从办，平均每年收录的论文数量仅无数十篇，可支撑亚秒级的模子切换响应。Aegaeon将模子切换开销降低97%，资本闲置严沉。正在阿里云模子市场为期超三个月的Beta测试中，而大量不常被挪用的“长尾”模子却各自独有着GPU资本。通过组件复用、显存精细化办理和KV缓存同步优化等全栈手艺，Aegaeon系统支撑单GPU同时办事多达7个分歧模子。

来源：中国互联网信息中心

上一篇：开展一对必然制化的分析金融赋能 下一篇：针对产物差同化、数据平安、市场推广等关心问

返回列表

新闻导航

的英伟达H20GPU数量从1192个减至213个

相关文章