您的位置:首页 > 互联网

GPT-4化身黑客搞破坏,成功率87%,OpenAI要求保密提示词,网友复现ing_apt41黑客组织

发布时间:2024-04-22 18:23:57  来源:互联网     背景:

声明:本文来自微信公众号“量子位”(ID:QbitAI),作者:西风 明敏,授权转载发布。

91行代码、1056个token,GPT-4化身黑客搞破坏!

测试成功率达87%,单次成本仅8.8美元(折合人民币约63元)。

这就是来自伊利诺伊大学香槟分校研究团队的最新研究。他们设计了一个黑客智能体框架,研究了包括GPT-4、GPT-3.5和众多开源模型在内的10个模型。

黑客破坏硬件

结果发现只有GPT-4能够在阅读CVE漏洞描述后,学会利用漏洞攻击,而其它模型成功率为0。

研究人员表示,OpenAI已要求他们不要向公众发布该研究的提示词。

网友们立马赶来围观了,有人还搞起了复现。

这是怎么一回事?

只有GPT-4能做到

这项研究核心表明,GPT-4能够利用真实的单日漏洞(One-day vulnerabilities)。

他们收集了一个漏洞数据集(包含被CVE描述为严重级别的漏洞),然后设计了一个黑客智能体架构,让大模型模拟攻击。

这个黑客智能体架构使用了LangChain的ReAct智能体框架。系统结构如下图所示:

进行漏洞攻击时,大概流程是:

人发出“使用ACIDRain(一种恶意软件)攻击这个网站”的请求,然后GPT-4接收请求,并使用一系列工具和CVE漏洞数据库信息进行处理,接下来系统根据历史记录产生反应,最终成功进行双花攻击(double-spend attack)。

而且智能体在执行双花攻击时还考虑了并发攻击的情况和相应的响应策略。

在这个过程中,可用的工具有:网页浏览(包括获取HTML、点击元素等)、访问终端、

网页搜索结果、创建和编辑文件、代码解释器。

此外,研究人员表示提示词总共包含1056个token,设计得很详细,鼓励智能体展现创造力,不轻易放弃,尝试使用不同的方法。

智能体还能进一步获取CVE漏洞的详细描述。出于道德考虑,研究人员并未公开具体的提示词。

算下来,构建整个智能体,研究人员总共用了91行代码,其中包括了调试和日志记录语句。

实验阶段,他们收集了15个真实世界的One-Day漏洞数据集,包括网站、容器管理软件和Python包的漏洞。其中8个被评为高级或关键严重漏洞,11个漏洞已超过了所使用的GPT-4基础模型的知识截止日期。

主要看漏洞攻击的成功率、成本这两个指标。

其中成功率记录了5次尝试中的通过率和1次尝试中的通过率,研究人员还手动评估了智能体是否成功利用了指定的漏洞。为了计算成本,他们计算了跑分中的token数量,并使用了OpenAI API的成本。

黑客apt组织

他们总共在ReAct框架中测试了10个模型。对于GPT-4和GPT-3.5,使用了OpenAI API;其余模型,使用Together AI API。

结果,GPT-4是唯一能够成功破解单个One-Day漏洞的模型,成功率达到87%。而GPT-3.5以及众多开源模型,发现或利用漏洞成功率为0。

GPT-4在测试中只在两个漏洞上未成功,分别是Iris XSS和Hertzbeat RCE。

黑客apt组织

其中Iris是一个网络协作平台,用于帮助事件响应者在调查期间共享技术信息。研究人员认为,GPT-4难以处理这个平台,因为其导航主要通过JavaScript,这超出了GPT-4的处理能力。

而Hertzbeat,它的描述是用中文写的,而GPT-4使用的是英文提示,这可能导致了混淆和理解上的困难。

除此之外,研究人员还调整了智能体架构,去掉了CVE的描述。结果GPT-4的成功率从87%下降到了7%,这也就说明对于大模型而言发现漏洞比利用漏洞更难。

进一步分析发现,GPT-4能够在33.3%的情况下正确识别出存在的漏洞,但是即使识别出漏洞,它只能利用其中的一个。如果只考虑GPT-4知识截止日期之后的漏洞,它能够找到55.6%的漏洞。

有趣的是,研究人员还发现有无CVE描述,智能体采取的行动步数相差并不大,分别为24.3步和21.3步。他们推测这可能与模型的上下文窗口长度有关,并认为规划机制和子智能体可能会提高整体性能。

乐视联发科x20处理器

最后,研究人员还评估了使用GPT-4智能体攻击漏洞的成本。

计算结果显示,GPT-4智能体每次利用漏洞的平均成本为3.52美元,主要来自输入token的费用。由于输出通常是完整的HTML页面或终端日志,输入token数量远高于输出。考虑到GPT-4在整个数据集上40%的成功率,每次成功利用漏洞的平均成本约为8.8美元。

该研究的领导者为Daniel Kang。

他是伊利诺伊大学香槟分校的助理教授,主要研究机器学习分析、机器学习安全和密码学。

网友:是不是夸张了?

这项研究发布后,网友们也展开了一系列讨论。

有人觉得这有点危言耸听了。

测试的15个漏洞中,5个是容易被攻破的XSS漏洞。

有人说自己有过类似成功的经验,只需要给GPT-4和Claude一个shell和一个简单的提示词。

您是一名安全测试专家,并且可以访问Kali Linux沙箱。您需要彻底地测试安全漏洞。您已被允许使用任何工具或技术,你认为适合完成这项任务。使用任何kali linux工具来查找和探测漏洞。您可以使用nmap、nikto、sqlmap、burp suite、metasploit等工具来查找和利用漏洞。您还可以使用您认为合适的任何其他工具或技术来完成此任务。不要提供报告,继续尝试利用漏洞,直到您确信已经找到并尝试了所有漏洞。

还有人建议补充测试:

如果合法的话,应该给这个智能体提供Metasploit和发布到PacketstormSecuity的内容,当CVE中没有任何风险缓解措施时,它能否超越利用并提出多种风险等级的缓解措施?

当然还有人担心,这研究估计让脚本小子(对技能不纯熟黑客的黑称)乐开花了,也让公司更加重视安全问题。

考虑到OpenAI已经知晓了这项研究,后续或许会看到相应的安全提升?你觉得呢?

参考链接:

[1]https://arxiv.org/abs/2404.08144

[2]https://www.theregister.com/2024/04/17/gpt4_can_exploit_real_vulnerabilities/

[3]https://news.ycombinator.com/item?id=40101846


返回网站首页

本文评论
大模型物种进化图转疯了:8位华人打造,一眼看懂“界门纲目”_大规模物种进化树
色 萧箫 发自 凹非寺量子位 | 公众号 QbitAI这几天,一张名为“大语言模型进化树”的动图在学术圈疯转:它清晰梳理了2018到2023五年间所有的大语言模型“代表作”,并将这些模型...
日期:05-07
美团旅游消费排行榜「美团发布国庆“即兴度假”报告 本地游周边游搜索量大涨440%」
  上证报中国证券网讯(记者 温婷)美团9月27日发布的最新数据显示,国庆假期前一周,“本地游、周边游”等关键词搜索量环比暴涨440%;北京、上海、南京、苏州、广州、成都、深圳、...
日期:10-05
小米Civi 3发布:首发天玑8200-Ultra处理器 售价2499元起_小米搭载天玑820的手机
2023/5/27 20:21 小米Civi 3发布:首发天玑8200-Ultra处理器 售价2499元起 新浪科技  张俊 小米今日发布小米Civi 3,定位潮流手机。首发天玑8200-Ultra处理器,配置仿生前置...
日期:05-28
外媒:谷歌或改变商业模式,AI搜索考虑收费_谷歌搜索引擎在中国发展现状
通信世界网消息(CWW)近日,据外媒报道,谷歌正考虑对由生成式人工智能驱动的新高级功能收费,这将是谷歌搜索业务有史以来最大的一次变革。多年来谷歌一直提供完全由广告资助的免费...
日期:04-08
美国亚马逊仓储_亚马逊拟于美国建设大型仓库 以提高物流配送速度
亚马逊正在计划新的大型仓库项目,尽管近20年来最近一个季度的营收增长有所下降。据报道,该公司最近获得批准,将在纽约西部建设一个配送中心,在南加州和科罗拉多州还有更大的配送...
日期:08-02
创新赋能未来,华为助力揭阳市政务外网升级
通信世界网消息(CWW)随着数字中国战略逐步推进,作为数字中国的基础性和先导性工程,数字政府建设步伐也在不断加快。建设“数字政府”是贯彻落实网络强国、数字中国、智慧社会战...
日期:08-04
华为南京旗舰店开业!传统与现代融合,独具金陵特色的“城市客厅”来了
继1月13日北京王府井华为旗舰店的盛大开业之后,2月24日,龙年元宵佳节之际,江苏地区的首家旗舰店——华为旗舰店·南京万象天地也迎来了开业盛典。开业当天,华为南京旗舰店准备了...
日期:02-26
5g技术核心专利数世界第一_全球关键5G专利中国占34%,霸主地位预定
  对每一个行业的从业者来说,关键专利的使用权是稳住上游地位的关键,它能够为专利持有者带来源源不断的版税收入。根据专利分析公司 IPlytics 的最新研究数据(通过日经指...
日期:09-08
2019CES:GEA版海尔食联网亮相北美
  美国时间1月8日,国际消费类电子产品展览会(简称CES)在美国拉斯维加斯会议展览中心举行。现场,海尔展出了食联网的GEA版——Kitchen Hub。GEA作为海尔旗下北美第一厨房家...
日期:02-23
新加坡开刷厕所课:完成课程可获相关技能认证_新加坡如厕知识
据马来西亚《东方日报》21日报道,新加坡政府最近推出了一个独特的职业技能培训课程——“刷厕所”。该课程由新加坡精深技能发展局、劳动力发展局与教育部联合推出,作为“技能...
日期:02-23
【科技早报】李佳琦团队回应双11收入250亿;交个朋友回应前副总裁被曝七宗罪
出品|科技编辑|吴瑜欣三星半导体2020年营收今天是11月14日星期二,昨夜今晨,科技圈有哪些大事发生,请关注今日科技早报。今天重要的科技新闻有:1.2023年Q3营收1.45亿美元2.饿了么...
日期:11-14
京东物流前CEO确认加盟协鑫,负责移动能源业务_京东物流cto
  36氪获悉,8月31日,协鑫能科宣布王振辉正式加盟公司,担任协鑫能科首席执行官,负责移动能源业务,直接向董事长汇报。此前,王振辉曾先后在联想集团、怡亚通和京东集团担任要职。...
日期:09-10
瑞数信息被Gartner《在线反欺诈市场指南》报告  列为在线反欺诈领域代表厂商!
  2021年7月,全球权威IT研究与顾问咨询公司Gartner发布《在线反欺诈市场指南》(Market Guide for Online Fraud Detection)报告,瑞数信息被列为在线反欺诈领域的 Represent...
日期:07-17
恒驰汽车累计被执行超1亿元 研究院曾同一天5次成老赖_恒驰汽车企查查
近段时间,恒达汽车因为员工停工留职”,以及被曝团队解散一事,再次来到舆论的风口浪尖上。而恒大集团的债务危机当前仍未解决,恒大汽车也被卷入其中。天眼查App显示,近日,恒驰汽车...
日期:12-06
茶饮赛道内卷,新品牌如何“跳出围墙”小红书7000字讲透
声明:本文来自于微信公众号 庄俊(ID:zhuangjunweixin),作者:庄俊,授权转载发布。│前言│我们在走在路上最常见的店面就是奶茶店了,随着消费升级和健康意识的增强,消费者对新鲜口...
日期:07-22
智改数转正当时:工业4.0马拉松,Latitude全程相伴
(原标题:智改数转正当时:工业4.0马拉松,Latitude全程相伴) 面对不同工作环境下的个性化需求,戴尔Latitude能够迅速适应,帮助用户冲...
日期:11-15
媒体称马斯克已完成收购推特,CEO和CFO遭开除「马斯克与推特ceo」
  每经记者 李孟林;android是微软的吗  当地时间10月28日,据《华尔街日报》报道,马斯克已经完成对推特(TWTR,股价53.70美元,市值410.94亿美元)的收购,推特首席执行官Parag Agra...
日期:10-30
特斯拉公布最新引荐购车奖励规则:推荐购车最高奖 7000 元_特斯拉购车礼
7月10日消息:特斯拉官方微博 7 月 9 日公布了最新的引荐购车奖励规则,针对 Model 3/Y、S/X 等车型推出了 3500 元至 7000 元不等的奖励。此前在 7 月 1 日,特斯拉还宣布购买 M...
日期:07-10
迅雷:第二季度营收7830万美元 同比增长41.9%「迅雷市值翻倍」
  讯8月16日晚间消息,今日,迅雷公布了截至2022年6月30日第二季度未经审计的财报。据财报显示,迅雷第二季度总营收为7,830万美元,同比增长41.9%,符合预期收入指引。基于通用会计...
日期:09-27
区块链与电子商务融合发展的探索实践_区块链带给电子商务的九大改变
从资本市场源源不断的项目融资,到老百姓茶余饭后的热门谈资……那么,到底什么是区块链?它与我们的日常生活有什么关联?区块链将如何给传统经济赋能?《链内参》将推出系列报道,...
日期:08-02