OpenSandbox:重新思考 Agent 时代的 Runtime|QCon北京

来源: InfoQ - AI&大模型

原文

从「AI For What」到「Value From AI」,100+可落地实践案例打通AI实战最后一公里!

4月16日-4月18日,QCon 全球软件开发大会将在北京举办。本届大会锚定 Agentic AI 时代的软件工程重塑,聚焦Agentic AI、多智能体协作、算力优化、技术债治理、多模态和AI 原生基础设施等前沿话题,邀请来自腾讯、阿里、百度、华为、蚂蚁、小米、网易等企业技术专家,带来百余项真实落地案例,系统性分享前沿洞察与实战干货,以技术共创探索 AI 落地新路径。

阿里巴巴高级技术专家、研发 TL陶宇田已确认出席 “Agent Infra 架构设计” 专题,并发表题为OpenSandbox:重新思考 Agent 时代的 Runtime的主题分享。本次演讲将结合阿里巴巴内部 Coding Agent、Agent 评测体系与 Coding 场景 RL 训练的真实实践,深入解析 OpenSandbox 在高吞吐执行、细粒度网络安全控制与企业级可扩展性上的关键设计与落地经验。

陶宇田,先后任职于亚马逊、阿里巴巴,拥有 15 年以上大型互联网架构设计与研发经验。技术领域覆盖中间件、推荐系统、云原生、分布式任务调度及 AI 基础设施等核心方向。目前担任阿里巴巴 Sandbox 领域负责人,主导 OpenSandbox 开源项目建设,聚焦 AI 场景下的沙箱运行时与基础设施创新,致力于构建安全、高效、可复用的 AI 执行环境。他在本次会议的详细演讲内容如下:

演讲提纲

1. AI Agent 执行环境的新挑战

Agent / RL 场景的共性诉求:高并发、短生命周期、可控网络

传统 Docker / K8s 方案的瓶颈与不足

2. OpenSandbox 的核心设计:Protocol-First

两层 OpenAPI:沙箱生命周期与执行能力抽象

多语言 SDK 一致性(Python / Java / JavaScript)

Runtime 解耦与可插拔(Docker / K8s)

3. 池化调度与极速交付

Pool + BatchSandbox 架构设计

秒级大规模交付:3.5s / 1000,10s / 5000

成本可控的复用与快速回收机制

4. Agent 场景下的安全执行

Coding Agent 面临的真实安全网络风险

对比现有方案的不足

OpenSandbox 的双层网络防护设计:

DNS 层 FQDN 级控制

L4 网络过滤

5. 真实落地案例

阿里巴巴内部 Coding Agent

主流 Coding 产品评测架构

Coding 场景 RL 训练系统

6. 未来演进方向

安全容器与企业级能力增强

可观测与审计

Agent 执行环境的 Serving 化探索

您认为,这样的技术在实践过程中有哪些痛点?

开放性 vs 功能复杂度:避免引入新概念、复用社区成熟概念(以 image 描述环境)

高吞吐 vs 资源成本:池化带来的成本与回收机制权衡

易用性 vs 极致调度效率:基于 K8s 生态与 nomad 的思考

演讲亮点

协议优先:先定义语义,再允许多种运行时实现,确保 SDK 与执行面一致,以及面向未来场景和实现的强大扩展能力

池化调度:面向企业级的大规模短时任务,提供秒级/千级交付能力

网络管控策略:面向 AI 任务的细粒度访问控制,可复用在不同运行时

听众收益

获得一套面向 AI Agent/RL 的“沙箱执行面”抽象方法与协议化设计思路

学到可复用的池化调度设计与性能优化路径

理解高吞吐执行场景下网络访问控制的关键策略与坑点

除此之外,本次大会还策划了Agentic Engineering多模态理解与生成的突破记忆觉醒:智能体记忆系统的范式重塑与产业落地具身智能与物理世界交互Agent Infra 架构设计AI 重塑数据生产与消费AI 原生基础设施AI 驱动的技术债治理小模型与领域适配模型大模型算力优化Agent 可观测性与评估工程AI for SRE等20多个专题论坛,届时将有来自不同行业、不同领域、不同企业的100+资深专家在QCon北京站现场带来前沿技术洞察和一线实践经验。

大会售票8折倒计时最后一周,更多详情可扫码或联系票务经理 18514549229 进行咨询。