整理 | 华卫

昨日，OpenAI 宣布收购了 Promptfoo以保障其AI 智能体的安全。这家成立于 2024 年的AI安全初创公司，专注于保护大语言模型免受网络攻击。OpenAI 在一篇博客文章中表示，交易完成后，Promptfoo 的技术将整合进 OpenAI Frontier，该平台是其近期推出的、供企业构建和管理 AI 智能体的平台。

而 Promptfoo 背后的故事简直令人难以置信：一位 Discord 工程师出于兴趣开发了一款 AI 安全工具。一夜之间，来自 Anthropic、亚马逊和 Shopify 的 25000 名工程师就开始使用它，这甚至在它正式发布之前。一年后，财富 500 强企业中有 25% 的公司和 100000 名工程师都在使用它。

23个人干两年，“收割”35万AI开发者

成立仅两年的 Promptfoo 开发用于测试AI系统安全的开源工具，其中包括开源界面与函数库，同时帮助企业通过模拟攻击自家产品来寻找漏洞，这一过程被称为红队演练。

这家总部位于旧金山的初创公司目前拥有 23 名员工，由Ian Webster和Michael D’Angelo创立，后者曾担任身份验证公司 Smile Identity 的工程副总裁兼AI负责人，拥有将机器学习解决方案扩展到服务超过一亿人、覆盖数百家企业的业绩。

Michael D’Angelo

Webster此前在 Discord 领导LLM工程和开发平台团队，将交付的AI产品扩展到2亿用户。他当时发现，安全行业尚未跟上时代：团队用来保障产品安全的工具，都是为另一个时代设计的。传统漏洞扫描器无法理解提示词注入，静态分析也无法识别模型向用户承诺超出其权限的内容。他得出结论：针对AI应用的测试基础设施，根本就不存在。

Ian Webster

于是，他利用夜晚和周末时间，自己动手打造了一个开源项目。后来，这个项目成为了 Promptfoo。

该产品的工作原理是扮演自动化攻击者。Promptfoo 平台不依赖人工渗透测试，而是通过聊天界面或 API 直接对接客户的AI应用，使用专门的模型与智能体模拟普通用户甚至攻击者的行为。一旦攻击成功，平台会记录结果、分析成因，并通过智能体推理循环迭代优化测试，暴露更深层的漏洞。平台针对的风险包括：提示词注入、数据泄露、模型越狱以及“应用层故障”，如AI系统向用户承诺无法兑现的功能、在客服查询中泄露数据库内容或在作业辅导中发表政治观点等。

Promptfoo于 2024 年正式商业化运营，并获得 a16z 500 万美元种子轮融资。该轮融资吸引了一众知名天使投资人，包括 Shopify 首席执行官Tobi Lütke、Discord 首席技术官Stanislav Vishnevskiy以及 Okta 联合创始人Frederic Kerrest。在2025 年 7 月，公司完成由 Insight Partners 领投、a16z 继续参投的 1840 万美元 A 轮融资。据金融数据平台 PitchBook 披露，Promptfoo 自成立以来仅融资 2300 万美元，最新一轮融资后的估值达 8600 万美元。

Webster刚刚在 X 上称，已有超过 35 万名开发者以及超过 25% 的世界 500 强企业使用其产品。

被收购后保持开源，还供Anthropic使用、捐款

本次收购的具体金额当前并未被披露，但OpenAI表示Promptfoo团队将加入OpenAI。Promptfoo 首席执行官Ian Webster在一份声明中表示，“随着 AI 智能体与真实数据和系统的连接日益紧密，对其进行安全防护与验证变得比以往任何时候都更具挑战性，也更为重要。加入 OpenAI 能让我们加速推进这项工作，为构建实际落地 AI 系统的团队提供更强的安全、保障与治理能力。”

在 X 平台上，OpenAI 还发文称，此次收购将 “强化 Frontier 平台内智能体的安全测试与评估能力”。作为本次收购的一部分，OpenAI Frontier 平台将新增自动化安全测试与红队演练功能。该产品还将具备帮助企业监控变更、追踪测试过程的能力，以满足风险管控与合规要求。OpenAI 将 Frontier 定位为企业的 “AI 同事”，旨在让智能体接入生产系统、客户关系管理平台、数据仓库、内部工单工具，并执行具有实际影响的工作流程。

并且，OpenAI 承诺，Promptfoo 将在现有许可下保持开源，并继续为现有客户提供支持。该开源项目允许开发者测试各类与 AI 相关的提示词和智能体，并对比 ChatGPT、Anthropic 的 Claude、谷歌 Gemini 等大语言模型的性能。“Promptfoo 依然是开源的。我们将继续维护项目，接受捐款，支持多种供应商和模式，并为客户服务。”D'Angelo也在昨日的LinkedIn帖子中表示。

在Github上，该项目获得了11.3k Stars。同时，该项目拥有超过 248 名贡献者，且被包括 Anthropic、谷歌在内的全行业开发者广泛使用。

开源项目链接：https://github.com/promptfoo/promptfoo#readme

头部AI玩家全面加码，安全工具集中上线

如今，OpenAI 及其竞争对手正竞相研发更先进的 AI 智能体，这些智能体可代表用户完成复杂任务，且仅需极少的人工干预。而当下，不法分子正利用类似技术寻找入侵关键网络的途径。能够自主执行数字任务的独立 AI 智能体的发展，让人们对生产力提升充满期待，也给不法分子提供了新的可乘之机，使其能够窃取敏感数据或操控自动化系统。

与此同时，每家大型AI开发商都正通过确保产品高效、安全，努力说服更多类型的企业为这项技术付费，但方式有所不同。

“OpenAI 收购 Promptfoo 明确表明，其致力于让企业级AI不仅强大，而且在规模化应用中安全可靠。” 投资机构 Insight Partners 董事总经理 Ganesh Bell 表示。Promptfoo 作为众多开发AI网络安全产品、用以防范黑客的初创公司之一，能够帮助大型企业在AI模型开发阶段发现并修复安全问题。

此外，OpenAI 也已着手为其AI产品和智能体加入安全功能。就在上周，该公司推出了一款旨在帮助安全团队发现并修复大型数据库漏洞的 AI 智能体Codex Security，在宣布收购 Promptfoo 当天正式扩大开放范围。

Anthropic 则是另一种选择：依托 Claude 代码内部自研构建。2 月，Anthropic 推出了 Claude Code Security，该工具利用Claude Opus 4.6的强大推理能力，可扫描整个代码库，发现传统规则型扫描器常忽略的上下文依赖型漏洞，并直接生成针对性修复补丁。

参考链接：

https://openai.com/index/openai-to-acquire-promptfoo/

https://techcrunch.com/2026/03/09/openai-acquires-promptfoo-to-secure-its-ai-agents/

https://thenextweb.com/news/openai-acquires-promptfoo-ai-security-frontier