您的位置:首页 > 互联网

OpenAI发布PVG:用小模型验证大模型输出,解决“黑盒”难题_openup模型

发布时间:2024-07-18 15:19:51  来源:互联网     背景:

声明:本文来自于微信公众号 AIGC开放社区(ID:AIGCOPEN),作者:AIGC开放社区,授权转载发布。

openup模型

7月18日凌晨,OpenAI在官网发布了最新技术研究——Prover-Verifier-Games。

随着ChatGPT在法律、金融、营销等领域的广泛使用,确保模型的安全、准确输出同时被很好理解变得非常重要。但由于神经网络的复杂和多变性,我们根本无法验证其生成内容的准确性,这也就会出现输出“黑盒”的情况。

ipad mini vs ipad

为了解决这个难题,OpenAI提出了全新训练框架Prover-Verifier Games(简称“PVG”),例如,用GPT-3这样的小模型来验证、监督,GPT-4大模型的输出,从而提升输出准确率以及可控性。

OpenAI论文地址:https://cdn.openai.com/prover-verifier-games-improve-legibility-of-llm-outputs/legibility.pdf

其实PVG技术概念早在2021年8月的一篇论文中就被提出来,OpenAI也正是受此灵感启发。这是一种基于博弈论的训练方法,通过模拟证明者和验证者之间的互动,提高模型的输出质量。

在这个机制中, Prover(证明者)的任务就是生成内容,而Verifier(验证者)的任务就是判断这些内容是否正确。

论文地址:https://arxiv.org/abs/2108.12099

我们如何在电子商务的发展浪潮中抓住机遇

PVG模块的核心思想是通过多轮迭代训练,来提升证明者和验证者的整体性能。在每一轮训练中,验证者首先使用监督学习来预测从之前轮次的证明者中采样的内容的正确性。

赛门铁克 收购

这样做的目的是让验证者学会如何从大量的内容中识别出正确的答案。随后,证明者通过强化学习来优化其生成的内容,使其不仅正确,还能够说服验证者来接受这些内容。

在验证的过程中,证明者和验证者的角色是相互依赖的。证明者需要生成能够说服验证者的内容,而验证者则需要具备足够的判断力来识别出正确的内容。

openup模型

为了进一步提升效率性,OpenAI在此基础之上又设计了两种强化类型的证明者,有用的证明者(Helpful prover)和狡猾的证明者(Sneaky prover)。

有用的证明者的目标是生成正确且有说服力的内容。它通过优化其生成的内容,使其能够被验证者接受。

而狡猾的证明者则试图生成错误但同样有说服力的内容,以此来欺骗验证者。这种设计不仅增加了训练的难度,也使得验证者必须具备更高的判断力和鲁棒性。

苹果市值一夜蒸发2800亿

在训练PVG时,每轮训练都包括验证者和证明者的优化。在每一轮中,验证者首先使用监督学习来预测内容的正确性,帮助验证者学会如何从大量的内容中识别出正确的答案。使证明者通过强化学习来优化其生成的内容。

例如,当用户提出问题“肖娜的父亲是肖娜的5倍。肖娜目前的年龄是阿莉亚的3倍。如果阿莉亚3岁,肖娜的父亲有多大?”

GPT-4的输出为45岁。

而验证者模型GPT-3需要确定阿莉亚的年龄,然后根据阿莉亚的年龄计算出肖娜的年龄,最后再根据肖娜的年龄计算出肖娜父亲的年龄,整个过程需要多轮验证。

此外,在训练过程中,OpenAI还引入了一种名为“可检查性训练”(checkability training)的方法。

通过交替训练验证器和证明者模型,从而验证使用监督学习来预测从之前轮次的证明者中采样的解决方案的正确性。证明者则使用强化学习,根据当前轮次验证器的接受度和解决方案的正确性来进行持续优化。

研究人员表示,随着训练轮次的增加,验证者的健全性逐渐提升,表现为对狡猾论证者生成的错误解决方案的抵抗力增强。同时,有益论证者生成的解决方案也变得更清晰,更易于被人类理解。

不过需要注意的是,在训练验证者模型时,需要大量真实、准确的标签数据,以提升其辨别真假的能力。也就是说,如果使用的验证模型存在偏差,那么验证的内容还是会出现非法输出的可能。


返回网站首页

本文评论
金融合规金句「通产评论:拓展“通信金融”合规是关键」
通产评论:拓展“通信金融”合规是关键 通信产业网|2023-06-25 11:06:24作者:伍霞来源:通信产业网oppovivo小米华为快充技术【通信产业网讯】(通信业法律观察家 伍霞)通信金融业务...
日期:06-26
尾灯间歇性不亮 特斯拉在澳召回上万辆汽车_特斯拉尾灯问题
日前,澳大利亚基础设施、交通、地区发展和通信部官网发布信息显示,由于尾灯问题,2022年在澳大利亚销售的15914辆特斯拉Model 3和Model Y都将被召回。澳大利亚官方表示,车灯问题...
日期:11-30
官宣!科大讯飞学习机独家冠名《一站到底》燃爆学习热潮_科大讯飞与教育部
  在素人选秀、全民狂欢、明星体验生活、大咖技能比拼“混战”的综艺年代,《一站到底》凭知识内涵和正能量特质为观众们所喜爱,成为综艺节目的“常青树”。由科大讯飞学习...
日期:01-14
xAI旗下聊天机器人Grok被指窃取OpenAI代码库并复制ChatGPT回应_聊天机器人 开源
12月12日消息,据外媒报道,近日,马斯克旗下人工智能初创公司xAI发布的首款生成式人工智能聊天机器人Grok在拒绝一名用户的请求时,引用了ChatGPT背后的开发商OpenAI的用例政策。对...
日期:12-13
高管接连出走 飘摇国美_国美高管离职
  来源:北京商报  18个月过去了,国美没有按照创始人黄光裕的豪言恢复市场地位,而是向着相反方向跌落。9月27日,国美确认国美电器CEO王巍和国美投资公司CEO何阳青均已相继离...
日期:09-28
nvidia下一代显卡「NVIDIA下一代GPU架构巨变!首次上马多芯片 学习AMD/Intel」
NVIDIA RTX 40系列、AMD RX 7000系列这一代显卡都已经布局完毕,而下一代还要等差不多两年,至少NVIDIA Blackwell在路线图上看要到2025年才会推出明年来一波Super系列?2021年就...
日期:09-19
博主暴力测评苹果Vision Pro:外屏硬度出人意料
快科技2月4日消息,据媒体报道,苹果Vision Pro目前已经正式开售,各大博主都对其进行测试、拆机,甚至有人玩起了暴力碰撞。AppleTrack对苹果Vision Pro进行了跌落碰撞测试,测试结果...
日期:02-05
李想:若乔布斯在世苹果汽车应该是理想MEGA这样_苹果创始人乔布斯离婚
快科技2月29日消息,近日,苹果放弃造车的消息传来,震惊了不少圈内外人士,李想本人也对其发表观点,称苹果放弃造车,选择聚焦人工智能是绝对正确的战略选择,时间点也合适。而李想最新...
日期:02-29
Synthesia将推新数字人头像模型EXPRESS-1 性能超越HeyGen
4月24日 消息:Synthesia,一家领先的人工智能公司,近日宣布即将推出一款新的数字人头像模型——EXPRESS-1。这款新模型的推出,无疑将进一步推动AI在视频制作领域的应用。EXPRESS...
日期:04-24
搬家师傅用上外骨骼机器人:没电梯也不怕上高楼了_外骨骼搬运机器人
7月17日消息,没想到科幻电影中才能见到的场景,竟然已经被应用到日常生活中去了。据央视网报道,当前正是不少租客的换租季,又恰逢高校毕业季,家政行业迎来旺季,为了提升效率,不少承...
日期:07-17
抖音封禁《千金小姐反击》等6部违规微短剧:宣扬不健康价值观_千金小姐含冤入狱电视剧叫什么名字
快科技4月10日消息,抖音黑板报官方账号今天发文称,近期平台发现部分微短剧宣扬不健康和非主流的家庭观、婚恋观,刻意放大和渲染夫妻、婆媳矛盾等内容,平台已下架相关违规微短剧6...
日期:04-10
搜索+AI!百度、英伟达联合举办搜索创新大赛
近日,百度文心一言宣布向全社会开放,首日,百度搜索就有超 3 亿次需求由生成式智能引擎解决;百度搜索“AI伙伴”当日访问用户数突破 400 万。在这样的背景下, 9 月 7 日,以“新搜...
日期:09-07
女生上班通勤4小时坐10趟地铁 网友称这是地狱级打工模式
最近,上海一位女生名叫亦亦(化名),每天上班通勤需要花费4小时,乘坐10趟地铁。她介绍道,因公司搬迁,本来只要1小时的单程通勤现在变成了2小时。早上10点开始上班,每天8点出门,经过5次...
日期:02-08
快手快说车助力奇瑞,虎哥说车领衔打造汽车云发布新标杆(快手上的虎哥说车简介)
  “眼睁睁看着它不属于我了”、“感觉错失一个亿”......原价十余万的奇瑞瑞虎汽车,在快手主播“虎哥说车”(快手ID:1264826899)的直播间里被半价抢走,一众观看直播的老铁...
日期:05-04
荣耀Magic5Pro:跌价1480元,12G+256G+100倍变焦
脱离了华为后的荣耀比以往更加强大,产品线很快就补齐了,从千元入门机到超高端的折叠屏手机,都有荣耀手机可以选择,而且都挺超值的。不过如果你最近考虑入手iPhone15这款低端手机...
日期:10-09
iOS17爆料人士被抓获 苹果成功打击内部消息泄露_iphone爆料
5月11日消息,据国外媒体报道,此前,爆料人analyst941曾泄露了大量关于苹果iOS17的细节,包括对控制中心的大改、苹果地图锁屏细节、改进的Wallet和Health应用UI等。然而,最新报道称...
日期:09-29
同城零售中场战事:美团补供给,京东引流量_美团新供给
举例分析团购网站的赢利模式   现有市场的巨大存量,还没有让京东和美团进入剑拔弩张的地步,但彼此的渗透却已经开始。   文;|;董洁;编辑;|;乔芊   来源:36氪   零售在...
日期:08-16
微软 用户数据「微软:客户所有数据不会被用于AI训练,数据第三方无提取权限」
7月4日,伦敦证券交易所集团(LSEG)2023市场展望论坛召开,微软(中国)有限公司金融行业总经理沈菲参与了金融GPT:构建、赋能和规范的圆桌论坛,并在论坛上发表了对于人工智能在金融行业...
日期:07-05
【手慢无】华为Mate50 8GB+256GB碎屏险套装现货!_华为mate30epro碎屏险怎么买
华为Mate50的货源比较紧缺,目前活动售价5799元,全国联保【赠】90天碎屏险季卡+晒单红包50元等好礼,晒单子返50块红包到手5749元,满888元减200元。华为Mate50正面采用一块6.7英寸...
日期:10-16
广西首个高铁物流基地开工建设(广西高铁项目开工)
  11 月 12 日消息,11 月 11 日上午,南宁高铁物流基地建设启动仪式在广西南宁市青秀区南宁第二动车所西侧举行,这是广西首个高铁物流基地,也是全国第二个开工建设的高铁物流...
日期:07-17