Promptfoo 被 OpenAI 收购

来源: InfoQ - AI&大模型

原文

整理 | 华卫

昨日,OpenAI 宣布收购了 Promptfoo以保障其AI 智能体的安全。这家成立于 2024 年的AI安全初创公司,专注于保护大语言模型免受网络攻击。OpenAI 在一篇博客文章中表示,交易完成后,Promptfoo 的技术将整合进 OpenAI Frontier,该平台是其近期推出的、供企业构建和管理 AI 智能体的平台。

而 Promptfoo 背后的故事简直令人难以置信:一位 Discord 工程师出于兴趣开发了一款 AI 安全工具。一夜之间,来自 Anthropic、亚马逊和 Shopify 的 25000 名工程师就开始使用它,这甚至在它正式发布之前。一年后,财富 500 强企业中有 25% 的公司和 100000 名工程师都在使用它。

23个人干两年,“收割”35万AI开发者

成立仅两年的 Promptfoo 开发用于测试AI系统安全的开源工具,其中包括开源界面与函数库,同时帮助企业通过模拟攻击自家产品来寻找漏洞,这一过程被称为红队演练。

这家总部位于旧金山的初创公司目前拥有 23 名员工,由Ian Webster和Michael D’Angelo创立,后者曾担任身份验证公司 Smile Identity 的工程副总裁兼AI负责人,拥有将机器学习解决方案扩展到服务超过一亿人、覆盖数百家企业的业绩。

Michael D’Angelo

Webster此前在 Discord 领导LLM工程和开发平台团队,将交付的AI产品扩展到2亿用户。他当时发现,安全行业尚未跟上时代:团队用来保障产品安全的工具,都是为另一个时代设计的。传统漏洞扫描器无法理解提示词注入,静态分析也无法识别模型向用户承诺超出其权限的内容。他得出结论:针对AI应用的测试基础设施,根本就不存在。

Ian Webster

于是,他利用夜晚和周末时间,自己动手打造了一个开源项目。后来,这个项目成为了 Promptfoo。

该产品的工作原理是扮演自动化攻击者。Promptfoo 平台不依赖人工渗透测试,而是通过聊天界面或 API 直接对接客户的AI应用,使用专门的模型与智能体模拟普通用户甚至攻击者的行为。一旦攻击成功,平台会记录结果、分析成因,并通过智能体推理循环迭代优化测试,暴露更深层的漏洞。平台针对的风险包括:提示词注入、数据泄露、模型越狱以及“应用层故障”,如AI系统向用户承诺无法兑现的功能、在客服查询中泄露数据库内容或在作业辅导中发表政治观点等。

Promptfoo于 2024 年正式商业化运营,并获得 a16z 500 万美元种子轮融资。该轮融资吸引了一众知名天使投资人,包括 Shopify 首席执行官Tobi Lütke、Discord 首席技术官Stanislav Vishnevskiy以及 Okta 联合创始人Frederic Kerrest。在2025 年 7 月,公司完成由 Insight Partners 领投、a16z 继续参投的 1840 万美元 A 轮融资。据金融数据平台 PitchBook 披露,Promptfoo 自成立以来仅融资 2300 万美元,最新一轮融资后的估值达 8600 万美元。

Webster刚刚在 X 上称,已有超过 35 万名开发者以及超过 25% 的世界 500 强企业使用其产品。

被收购后保持开源,还供Anthropic使用、捐款

本次收购的具体金额当前并未被披露,但OpenAI表示Promptfoo团队将加入OpenAI。Promptfoo 首席执行官Ian Webster在一份声明中表示,“随着 AI 智能体与真实数据和系统的连接日益紧密,对其进行安全防护与验证变得比以往任何时候都更具挑战性,也更为重要。加入 OpenAI 能让我们加速推进这项工作,为构建实际落地 AI 系统的团队提供更强的安全、保障与治理能力。”

在 X 平台上,OpenAI 还发文称,此次收购将 “强化 Frontier 平台内智能体的安全测试与评估能力”。作为本次收购的一部分,OpenAI Frontier 平台将新增自动化安全测试与红队演练功能。该产品还将具备帮助企业监控变更、追踪测试过程的能力,以满足风险管控与合规要求。OpenAI 将 Frontier 定位为企业的 “AI 同事”,旨在让智能体接入生产系统、客户关系管理平台、数据仓库、内部工单工具,并执行具有实际影响的工作流程。

并且,OpenAI 承诺,Promptfoo 将在现有许可下保持开源,并继续为现有客户提供支持。该开源项目允许开发者测试各类与 AI 相关的提示词和智能体,并对比 ChatGPT、Anthropic 的 Claude、谷歌 Gemini 等大语言模型的性能。“Promptfoo 依然是开源的。我们将继续维护项目,接受捐款,支持多种供应商和模式,并为客户服务。”D'Angelo也在昨日的LinkedIn帖子中表示。

在Github上,该项目获得了11.3k Stars。同时,该项目拥有超过 248 名贡献者,且被包括 Anthropic、谷歌在内的全行业开发者广泛使用。

开源项目链接:https://github.com/promptfoo/promptfoo#readme

头部AI玩家全面加码,安全工具集中上线

如今,OpenAI 及其竞争对手正竞相研发更先进的 AI 智能体,这些智能体可代表用户完成复杂任务,且仅需极少的人工干预。而当下,不法分子正利用类似技术寻找入侵关键网络的途径。能够自主执行数字任务的独立 AI 智能体的发展,让人们对生产力提升充满期待,也给不法分子提供了新的可乘之机,使其能够窃取敏感数据或操控自动化系统。

与此同时,每家大型AI开发商都正通过确保产品高效、安全,努力说服更多类型的企业为这项技术付费,但方式有所不同。

“OpenAI 收购 Promptfoo 明确表明,其致力于让企业级AI不仅强大,而且在规模化应用中安全可靠。” 投资机构 Insight Partners 董事总经理 Ganesh Bell 表示。Promptfoo 作为众多开发AI网络安全产品、用以防范黑客的初创公司之一,能够帮助大型企业在AI模型开发阶段发现并修复安全问题。

此外,OpenAI 也已着手为其AI产品和智能体加入安全功能。就在上周,该公司推出了一款旨在帮助安全团队发现并修复大型数据库漏洞的 AI 智能体Codex Security,在宣布收购 Promptfoo 当天正式扩大开放范围。

Anthropic 则是另一种选择:依托 Claude 代码内部自研构建。2 月,Anthropic 推出了 Claude Code Security,该工具利用Claude Opus 4.6的强大推理能力,可扫描整个代码库,发现传统规则型扫描器常忽略的上下文依赖型漏洞,并直接生成针对性修复补丁。

参考链接:

https://openai.com/index/openai-to-acquire-promptfoo/

https://techcrunch.com/2026/03/09/openai-acquires-promptfoo-to-secure-its-ai-agents/

https://thenextweb.com/news/openai-acquires-promptfoo-ai-security-frontier