>>返回【卡城华人网】主页




卡城新闻   加国新闻   即时新闻   娱乐八卦    最新科技   读者文摘   养生保健   美食饮品    居家生活   音乐诗画   艺术中心   风筝专辑   
房屋租赁   求职招聘   便民广告   定居指南    城市介绍   房产动态   留学移民   华人故事    教育话题   财经信息   精华旅游   难得一笑   

>>返回【卡城华人网】主页





卡城新闻  加国新闻  即时新闻  娱乐八卦
最新科技  读者文摘  养生保健  美食饮品
居家生活  音乐诗画  艺术中心  风筝专辑
房屋租赁  求职招聘  便民广告  定居指南
城市介绍  房产动态  留学移民  华人故事
教育话题  财经信息  精华旅游  难得一笑

最新科技
 卡城华人网信息中心
 最新科技
     阿里巴巴新论文:GPU 资源节省达82%

阿里巴巴新论文:GPU 资源节省达82%

【卡城华人网 www.calgarychina.ca】  2025-10-21 11:42
  免责声明: 本消息未经核实,不代表网站的立场、观点,如有侵权,请联系删除。
【卡城华人网】阿里巴巴新论文:GPU 资源节省达82%

中国科技巨头阿里巴巴旗下阿里云最近发表论文〈Aegaeon: Effective GPU Pooling for Concurrent LLM Serving on the Market〉,介绍GPU 资源池化管理「Aegaeon」,成功解决大型语言模型(LLM)推理服务GPU 资源浪费问题。

系统允许高达十个模型共享一颗Nvidia H20 GPU,大幅提升硬体利用率。为期三个月Beta测试,GPU量由1,192张减少至213张,达成82%节省,并同时提高有效输出(Goodput)1.5~9倍。已用于阿里云AI平台「百练」,有效降低硬体采购成本,提升服务效率。



阿里云指出,尽管市场有超过百万个AI模型,但多数流量集中少数几个。由于GPU记忆体容量限制,通常每颗GPU只能执行两三个模型,导致大规模GPU闲置,浪费严重。 Aegaeon出现,不仅缓解GPU硬体需求,亦对面临美国制裁晶片供应紧张的局势产生积极影响。

论文已被顶级学术会议ACM SIGOPS今年第31届操作系统原理研讨会(SOSP)录用,于系统软体与AI大模型具前瞻性和实用价值。阿里云CEO吴泳铭表示,继续推动全栈AI基建升级,致力成为全球领先全栈人工智慧商,迎接超级人工智慧时代。

业界评论指出,Aegaeon代表阿里云GPU运用效率重要提升,但类似资源共享其他大型云端服务商也在进行,未必属革命性突破。尽管如此,AI模型多样化和行业特化需求增加,高效GPU资源管理将成为云端商赢得市场的关键。

来源: TechNews

编辑(Edit)     删除(Delete)







>>返回【卡城华人网】主页




版权所有(C), 2002-2025, 卡城华人网中国版 www.calgarychina.ca

版权所有(C), 2002-2025, 卡城华人网中国版 www.calgarychina.ca