汽车之家 AI 助手多 Agent 设计与多阶段优化策略|QCon北京
来源: InfoQ - AI&大模型
从「AI For What」到「Value From AI」,100+可落地实践案例打通AI实战最后一公里!
4月16日-4月18日,QCon 全球软件开发大会将在北京举办。本届大会锚定 Agentic AI 时代的软件工程重塑,聚焦Agentic AI、多智能体协作、算力优化、技术债治理、多模态和AI 原生基础设施等前沿话题,邀请来自腾讯、阿里、百度、华为、蚂蚁、小米、网易等企业技术专家,带来百余项真实落地案例,系统性分享前沿洞察与实战干货,以技术共创探索 AI 落地新路径。
汽车之家算法平台部负责人马宝昌已确认出席 “Agentic Engineering” 专题,并发表题为《汽车之家 AI 助手多 Agent 设计与多阶段优化策略》的主题分享。随着汽车之家AI助手的快速发展,多Agent架构成为提升系统智能化水平的关键技术。然而,多Agent系统面临协同效率低、训练复杂度高、优化策略单一等挑战,限制了AI助手的规模化应用。本次演讲将重点介绍汽车之家AI助手的多Agent设计架构及多阶段优化策略,通过真实业务数据和可复现的技术方案,展示如何通过多Agent协同和分阶段优化提升AI助手的决策能力和用户体验,推动汽车之家AI助手从单一功能向智能生态演进。
马宝昌,目前作为汽车之家大模型负责人,主要负责汽车行业大模型落地方面的工作。北京大学智能系硕士,10余年NLP算法研究和落地经验。他在本次会议的详细演讲内容如下:
演讲提纲
汽车之家AI助手Agent架构设计
智能体平台与生态建设:面向汽车行业的智能体生态平台,包括SOP编排、行业MCP工具、生态子Agent等
RAG与KAG结合的知识检索架构:多源数据处理与质量判别流程,满足深度逻辑推理和业务准召要求
汽车之家AI助手多Agent设计:记忆、看选、买车、用车等子Agent设计方案
2. 层次评测体系建设
多层次评测架构设计:应用层、组件层、模型层、知识层四层评测架构
评测指标体系:分层评测指标与业务价值指标
从标注到自动化的评测流程:从主观评测到客观评测再到持续优化的完整流程演进
3. 基于多阶段强化学习的优化流程
非参数优化策略:提示词优化、记忆机制设计和工具描述优化等策略
单Agent强化学习策略:从产品定义回复的标准答案到业务真实反馈的多阶段优化流程
多Agent协同训练方法:Reward设计与多Agent强化学习训练框架性能优化
4. 智能体性能与成本优化
模型推理性能优化:模型蒸馏、量化、投机采样、MTP等方法
Agent端到端相应速度:工具合并、工具/Agent并行以及思考长度优化
这样的技术在实践过程中有哪些痛点?
数据需求:高质量多Agent协同反馈数据获取成本高
计算成本:多Agent并行训练的成本高
系统复杂度:多模块(比价Agent、推荐Agent、服务Agent)协同训练的工程复杂度高
演讲亮点
RAG+KAG结合技术:多Agent知识检索架构,应对复杂场景检索
多阶段多Agent强化学习策略:基于多阶段Reward设计的强化学习训练流程
听众收益
掌握多阶段强化学习训练方法:学习从产品定义到在线优化的完整训练流程
了解多层次评测体系建设:应用-组件-模型-知识的全方位评测方法论
除此之外,本次大会还策划了Agentic Engineering、多模态理解与生成的突破、记忆觉醒:智能体记忆系统的范式重塑与产业落地、具身智能与物理世界交互、Agent Infra 架构设计、AI 重塑数据生产与消费、AI 原生基础设施、AI 驱动的技术债治理、小模型与领域适配模型、大模型算力优化、Agent 可观测性与评估工程、AI for SRE等20多个专题论坛,届时将有来自不同行业、不同领域、不同企业的100+资深专家在QCon北京站现场带来前沿技术洞察和一线实践经验。
更多详情可扫码或联系票务经理 18514549229 进行咨询。
