PyTorch基金会迎来Ray项目,并推出Monarch简化分布式AI开发
来源: InfoQ - AI&大模型
在2025年的PyTorch大会"上,PyTorch基金会宣布了几项举措,旨在推动开放、可扩展的AI基础设施建设。分布式计算框架Ray作为一个托管项目加入"PyTorch基金会。基金会还宣布了一个新框架PyTorch Monarch",旨在简化跨多台机器的分布式AI工作负载。该活动还重点介绍了全新的开放研究项目,包括斯坦福大学的Marin"和AI2的Olmo-Thinking",突显了基础模型开发对透明度和可复现性日益增长的推动力。
Ray的加入反映了基金会更广泛的战略布局——旨在构建一个统一的开放式生态系统,涵盖模型开发、服务和分布式执行。Ray最初是在加州大学伯克利分校的RISELab开发的,它提供了一套简洁的Python原语,使得分布式计算像编写本地代码一样直观,使开发者能够无缝地扩展到训练、调优和推理工作负载。
对于最近加入PyTorch基金会的其他项目,包括用于分布式训练的DeepSpeed"和用于高吞吐量推理的vLLM",Ray的加入是一个很好补充。PyTorch、DeepSpeed、vLLM和Ray共同构成了一个连贯的开源技术栈,覆盖了从实验到生产规模部署的整个模型生命周期。

图片来源:PyTorch基金会博客"
同时,Meta PyTorch团队推出了PyTorch Monarch。这是一个旨在将整个GPU集群抽象为单个逻辑设备的框架。Monarch提供了类似数组的网格接口,允许开发者使用Pythonic结构表达并行性,而数据和计算分布由系统自动管理。Monarch的后端基于Rust构建,旨在将性能与安全性结为一体,减少分布式编程的认知负担。
大会进一步强调了在基础模型开发和研究中的开放合作。在主题演讲中,斯坦福大学的Percy Liang介绍了Marin",这是一个设在基础模型研究中心"下的开放实验室。该实验室致力于通过公开数据集、代码、超参数及训练日志,实现前沿人工智能研发的完全透明化,从而保障研究的可重复性并促进社区参与。
同样,Ai2高级研究科学家Nathan Lambert介绍了Olmo-Thinking"。这是一个开放式推理模型,其训练过程、模型架构决策、数据来源和训练代码设计的细节都已经公布,而在封闭模型发布中,这些信息通常都是不公开的。这些举措很好地契合了推动基础模型开放与可复现的广泛趋势。
通过将工作范围扩展至核心框架开发之外,PyTorch基金会正致力于成为开放式人工智能基础设施的核心枢纽。即将于2026年在圣何塞举办的PyTorch大会,预计会继续聚焦生态系统协作与开发者赋能。
声明:本文为InfoQ翻译,未经许可禁止转载。
原文链接:https://www.infoq.com/news/2025/10/pytorch-conf-ray-monarch/"