|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
卡城新闻 加国新闻 即时新闻 娱乐八卦
最新科技 读者文摘 养生保健 美食饮品
居家生活 音乐诗画 艺术中心 风筝专辑 房屋租赁 求职招聘 便民广告 定居指南 城市介绍 房产动态 留学移民 华人故事 教育话题 财经信息 精华旅游 难得一笑 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
卡城新闻 加国新闻 即时新闻 娱乐八卦 最新科技 读者文摘 养生保健 美食饮品 居家生活 音乐诗画 艺术中心 风筝专辑 房屋租赁 求职招聘 便民广告 定居指南 城市介绍 房产动态 留学移民 华人故事 教育话题 财经信息 精华旅游 难得一笑 |
| 最新科技 |
 卡城华人网信息中心![]()  最新科技
     ![]()  阿里巴巴新论文:GPU 资源节省达82%
|
|
【卡城华人网 www.calgarychina.ca】  2025-10-21 11:42   免责声明: 本消息未经核实,不代表网站的立场、观点,如有侵权,请联系删除。 |
|
中国科技巨头阿里巴巴旗下阿里云最近发表论文〈Aegaeon: Effective GPU Pooling for Concurrent LLM Serving on the Market〉,介绍GPU 资源池化管理「Aegaeon」,成功解决大型语言模型(LLM)推理服务GPU 资源浪费问题。 系统允许高达十个模型共享一颗Nvidia H20 GPU,大幅提升硬体利用率。为期三个月Beta测试,GPU量由1,192张减少至213张,达成82%节省,并同时提高有效输出(Goodput)1.5~9倍。已用于阿里云AI平台「百练」,有效降低硬体采购成本,提升服务效率。
阿里云指出,尽管市场有超过百万个AI模型,但多数流量集中少数几个。由于GPU记忆体容量限制,通常每颗GPU只能执行两三个模型,导致大规模GPU闲置,浪费严重。 Aegaeon出现,不仅缓解GPU硬体需求,亦对面临美国制裁晶片供应紧张的局势产生积极影响。 论文已被顶级学术会议ACM SIGOPS今年第31届操作系统原理研讨会(SOSP)录用,于系统软体与AI大模型具前瞻性和实用价值。阿里云CEO吴泳铭表示,继续推动全栈AI基建升级,致力成为全球领先全栈人工智慧商,迎接超级人工智慧时代。 业界评论指出,Aegaeon代表阿里云GPU运用效率重要提升,但类似资源共享其他大型云端服务商也在进行,未必属革命性突破。尽管如此,AI模型多样化和行业特化需求增加,高效GPU资源管理将成为云端商赢得市场的关键。 来源: TechNews 编辑(Edit)     删除(Delete) |
|
|
|
| 版权所有(C), 2002-2025, 卡城华人网中国版 www.calgarychina.ca |
| 版权所有(C), 2002-2025, 卡城华人网中国版 www.calgarychina.ca |