研究团队设计了一个黑客智能体框架，研究了包括GPT-4、GPT-3.5和众多开源模型在内的10个模型。结果发现只有GPT-4能够在阅读CVE(

Common Vulnerabilities and Exposures）是一种用于标识和跟踪计算机系统中已知漏洞的公共标准。)漏洞描述后，学会利用漏洞攻击，而其它模型成功率为0。

这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架，研究了包括GPT-4、GPT-3.5和众多开源模型在内的10个模型。研究人员表示，OpenAI已要求他们不要向公众发布该研究的提示词。

主要看漏洞攻击的成功率、成本这两个指标。其中成功率记录了5次尝试中的通过率和1次尝试中的通过率，研究人员还手动评估了智能体是否成功利用了指定的漏洞。为了计算成本，他们计算了跑分中的token数量，并使用了OpenAI API的成本。

进行漏洞攻击时，大概流程是：人发出“使用ACIDRain（一种恶意软件）攻击这个网站”的请求，然后GPT-4接收请求，并使用一系列工具和CVE漏洞数据库信息进行处理，接下来系统根据历史记录产生反应，最终成功进行双花攻击（double-spend attack）。

最后，研究人员还评估了使用GPT-4智能体攻击漏洞的成本。计算结果显示，GPT-4智能体每次利用漏洞的平均成本为3.52美元，主要来自输入token的费用。由于输出通常是完整的HTML页面或终端日志，输入token数量远高于输出。考虑到GPT-4在整个数据集上40%的成功率，每次成功利用漏洞的平均成本约为8.8美元。

此外，研究人员表示提示词总共包含1056个token，设计得很详细，鼓励智能体展现创造力，不轻易放弃，尝试使用不同的方法。

算下来，构建整个智能体，研究人员总共用了91行代码，其中包括了调试和日志记录语句。

他们收集了一个漏洞数据集（包含被CVE描述为严重级别的漏洞），然后设计了一个黑客智能体架构，让大模型模拟攻击。

这项研究核心表明，GPT-4能够利用真实的单日漏洞（One-day vulnerabilities）。智能体还能进一步获取CVE漏洞的详细描述。出于道德考虑，研究人员并未公开具体的提示词。

实验阶段，他们收集了15个真实世界的One-Day漏洞数据集，包括网站、容器管理软件和Python包的漏洞。其中8个被评为高级或关键严重漏洞，11个漏洞已超过了所使用的GPT-4基础模型的知识截止日期。

结果，GPT-4是唯一能够成功破解单个One-Day漏洞的模型，成功率达到87%。而GPT-3.5以及众多开源模型，发现或利用漏洞成功率为0。

GPT-4化身AI黑客，探秘漏洞攻击利器！

分享文章

其他文章

最近越南盾为何暴跌？

前索罗斯副手，亿万富翁减仓七成英伟达

重塑楼市！国资是如何激活存量房

芝商所计划进军比特币现货，Coinbase股价暴跌9.4%！

字节跳动的“大模型革命”，价格屠夫重塑AI市场

美股创历史新高！美国CPI点燃美联储降息预期

关于Finhalo

联系我们

Follow on: