汽车之家 AI 助手多 Agent 设计与多阶段优化策略|QCon北京

Source: InfoQ - AI & LLM

从「AI For What」到「Value From AI」,100+可落地实践案例打通AI实战最后一公里!

4月16日-4月18日,QCon 全球软件开发大会将在北京举办。本届大会锚定 Agentic AI 时代的软件工程重塑,聚焦Agentic AI、多智能体协作、算力优化、技术债治理、多模态和AI 原生基础设施等前沿话题,邀请来自腾讯、阿里、百度、华为、蚂蚁、小米、网易等企业技术专家,带来百余项真实落地案例,系统性分享前沿洞察与实战干货,以技术共创探索 AI 落地新路径。

汽车之家算法平台部负责人马宝昌已确认出席 “Agentic Engineering” 专题,并发表题为汽车之家 AI 助手多 Agent 设计与多阶段优化策略的主题分享。随着汽车之家AI助手的快速发展,多Agent架构成为提升系统智能化水平的关键技术。然而,多Agent系统面临协同效率低、训练复杂度高、优化策略单一等挑战,限制了AI助手的规模化应用。本次演讲将重点介绍汽车之家AI助手的多Agent设计架构及多阶段优化策略,通过真实业务数据和可复现的技术方案,展示如何通过多Agent协同和分阶段优化提升AI助手的决策能力和用户体验,推动汽车之家AI助手从单一功能向智能生态演进。

马宝昌,目前作为汽车之家大模型负责人,主要负责汽车行业大模型落地方面的工作。北京大学智能系硕士,10余年NLP算法研究和落地经验。他在本次会议的详细演讲内容如下:

演讲提纲

汽车之家AI助手Agent架构设计

智能体平台与生态建设:面向汽车行业的智能体生态平台,包括SOP编排、行业MCP工具、生态子Agent等

RAG与KAG结合的知识检索架构:多源数据处理与质量判别流程,满足深度逻辑推理和业务准召要求

汽车之家AI助手多Agent设计:记忆、看选、买车、用车等子Agent设计方案

2. 层次评测体系建设

多层次评测架构设计:应用层、组件层、模型层、知识层四层评测架构

评测指标体系:分层评测指标与业务价值指标

从标注到自动化的评测流程:从主观评测到客观评测再到持续优化的完整流程演进

3. 基于多阶段强化学习的优化流程

非参数优化策略:提示词优化、记忆机制设计和工具描述优化等策略

单Agent强化学习策略:从产品定义回复的标准答案到业务真实反馈的多阶段优化流程

多Agent协同训练方法:Reward设计与多Agent强化学习训练框架性能优化

4. 智能体性能与成本优化

模型推理性能优化:模型蒸馏、量化、投机采样、MTP等方法

Agent端到端相应速度:工具合并、工具/Agent并行以及思考长度优化

这样的技术在实践过程中有哪些痛点?

数据需求:高质量多Agent协同反馈数据获取成本高

计算成本:多Agent并行训练的成本高

系统复杂度:多模块(比价Agent、推荐Agent、服务Agent)协同训练的工程复杂度高

演讲亮点

RAG+KAG结合技术:多Agent知识检索架构,应对复杂场景检索

多阶段多Agent强化学习策略:基于多阶段Reward设计的强化学习训练流程

听众收益

掌握多阶段强化学习训练方法:学习从产品定义到在线优化的完整训练流程

了解多层次评测体系建设:应用-组件-模型-知识的全方位评测方法论

除此之外,本次大会还策划了Agentic Engineering多模态理解与生成的突破记忆觉醒:智能体记忆系统的范式重塑与产业落地具身智能与物理世界交互Agent Infra 架构设计AI 重塑数据生产与消费AI 原生基础设施AI 驱动的技术债治理小模型与领域适配模型大模型算力优化Agent 可观测性与评估工程AI for SRE等20多个专题论坛,届时将有来自不同行业、不同领域、不同企业的100+资深专家在QCon北京站现场带来前沿技术洞察和一线实践经验。

更多详情可扫码或联系票务经理 18514549229 进行咨询。