AI

相关主题:
工程实践、Kubernetes、反馈飞轮、评测基准饱和、FACTS 基准、Memori、R-HORIZON、Evalite
Martin Fowler (软件设计)2026/4/8

Thoughtworks关于AI辅助开发的团队学习框架。

SWE-bench Verified因饱和与污染退役,行业转向更难的新基准。

全新的模型事实准确性四维评估基准问世。

Memori用标准数据库替代向量库实现Agent长期记忆的开源方案

复旦与美团联合提出R-HORIZON框架,揭示大型推理模型长链推理能力边界

TypeScript 原生 LLM 评估运行器 Evalite 发布 v1 beta。

Nexla推出对话式AI数据工程平台Express,自然语言构建数据管道。

AWS提出四象限Agentic AI安全框架,按自主性与权限分级定义安全控制。

KServe被CNCF TOC投票接受为孵化项目。

Cursor 2.0发布,核心更新包括自研Composer模型、多Agent并行、内置浏览器和语音模式。

Anthropic推出Skills,以代码定义可复用任务组件,区别于GPTs的图形化配置。

Eclipse开源LMOS平台,用Kotlin+ADL让JVM生态企业无需换Python栈即可构建Agent。

资深工程师开始并行运行多个 AI 编码代理提升产出