|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
|
卡城新闻 加国新闻 即时新闻 娱乐八卦
最新科技 读者文摘 养生保健 美食饮品
居家生活 移民茶馆 艺术中心 风筝专辑 房屋租赁 求职招聘 便民广告 定居指南 城市介绍 房产动态 留学移民 华人故事 教育话题 财经信息 精华旅游 难得一笑 |
|
|
|
|
|
|
|
|
|
|
|
|
|
|
卡城新闻 加国新闻 即时新闻 娱乐八卦 最新科技 读者文摘 养生保健 美食饮品 居家生活 移民茶馆 艺术中心 风筝专辑 房屋租赁 求职招聘 便民广告 定居指南 城市介绍 房产动态 留学移民 华人故事 教育话题 财经信息 精华旅游 难得一笑 |
| 最新科技 |
 卡城华人网信息中心![]()  最新科技
     ![]()  OpenAI携手业界伙伴提出MRC协定,解决AI运算网路瓶颈
|
|
【卡城华人网 www.calgarychina.ca】  2026-05-11 11:43   免责声明: 本消息未经核实,不代表网站的立场、观点,如有侵权,请联系删除。 |
|
OpenAI 与来自AMD、博通、英特尔、微软、NVIDIA 的研究人员近日联手发表一篇新论文,揭露OpenAI 训练技术堆叠的内部运作,并推出一项全新的运算网路通讯协定,在关键基础设施层级采行共享标准,有助于更具效率、更可靠地扩展AI 系统规模,拓展至广泛的合作伙伴生态系。
新论文介绍一项名为MRC(Multipath Reliable Connection)的通讯协定,本质上是解决AI 基础设施运算网路所面临得两大难题:壅塞与故障。随着GPU 丛集规模扩大,这两个问题会越来越难解决。 MRC 仰赖所谓packet spraying,本质上是将流量分散至网路中的数百条路径,防止任何单一网路连结出现壅塞。同时降低GPU 丛集中的「层级」数量,形成更为扁平的网路结构,进而降低资料中心的运算和电力消耗。 处理故障方面,MRC 能在路径中断时,在微秒级时间内侦测并重新引导路径。这让GPU 丛集即便在网路部分区段发生故障,也能继续训练。 此外,MRC 还与一项名为SRv6(IPv6 Segment Routing)的通讯协定搭配使用,后者是直接告诉数据应在网路中经过确切路径,而非强迫网路交换器自行作业,进一步降低这些交换器以及整体资料中心的能源需求。 MRC 已在OpenAI 和微软最大规模的训练丛集投入使用,包括微软的Fairwater 资料中心、OCI(Oracle Cloud Infrastructure)的Abilene 资料中心,也被用于训练多款OpenAI 模型。 这项研发2 年的通讯协定,对OpenAI 扩展所需运算资源以持续打造规模更大、表现更出色的模型相当重要,这样的设计方法加速OpenAI 对于Stargate 计画的愿景。 传统大规模AI 训练任务对GPU 丛集而言可说是一个故障放大器,只要一个环节出错,连锁效应便会迫使整个流程戛然而止,让GPU 处于闲置状态。此外,网路壅塞也会拖慢研究团队的创新速度。而MRC 绕过这些问题,让OpenAI 能以更快的速度推动整个研究流程,更充分运用手上所拥有的资源。 MRC 规格目前透过OCP(Open Compute Project,开放运算计画)以开放授权的形式释出。 OpenAI 强调此一决定的重要性,并表示这项通讯协定并非OpenAI 想借此形成差异化,而是希望带领整个产业跨越传统瓶颈。 来源:科技新报 编辑(Edit)     删除(Delete) |
|
|
|
| 版权所有(C), 2002-2026, 卡城华人网中国版 www.calgarychina.ca |
| 版权所有(C), 2002-2026, 卡城华人网中国版 www.calgarychina.ca |