您的位置:首页 > 互联网

OpenAI华人VP翁荔离职:北大校友,掌管安全,最近B站分享被热议_翁忛简介

发布时间:2024-11-10 10:55:06  来源:互联网     背景:

声明:本文来自于微信公众号 金磊 发自 凹非寺 量子位 | 公众号 QbitAI,作者:金磊,授权转载发布。

就在刚刚,那个掌管OpenAI安全的北大校友,OpenAI研究副总裁(安全)翁荔,离职了。

翁荔是OpenAI华人科学家、ChatGPT的贡献者之一。

rog幻16抢购

北大毕业后,翁荔在2018年加入OpenAI,后来在GPT-4项目中主要参与预训练、强化学习和对齐、模型安全等方面的工作。

最著名的Agent公式也由她提出,即:Agent=大模型+记忆+主动规划+工具使用。

而就在前不久,她还刚刚现身2024Bilibili 超级科学晚活动,发表了《AI安全与“培养”之道》的主题演讲。

在她宣布离职消息之后,包括OpenAI在内的众多同事发来了祝福:

翁荔的离职信

在推文中,翁荔也分享了他跟团队做的最后的道别。

以下为离职信的完整内容。

亲爱的朋友们:

我做出了一个非常艰难的决定,将于11月15日离开OpenAI,这将是我在公司最后一天。

OpenAI是我成长为科学家和领导者的地方,我将永远珍惜在这里与每一位共事的伙伴度过的时光。OpenAI团队一直是我的知己、导师以及我身份的一部分。

我仍然记得2017年初加入OpenAI时的那份好奇和热情。当时我们是一群怀抱着不可能与科幻未来梦想的人。

我在这里开始了我的全栈机器人挑战之旅——从深度强化学习算法,到感知,再到固件开发——目标是教会一个简单的机械手如何解开魔方。这花费了整个团队两年时间,但最终我们成功了。

当OpenAI进入GPT领域时,我们开始探索如何将最先进的AI模型应用于现实世界。我建立了第一个应用研究团队,推出了初始版本的微调API、嵌入API和审核端点,为应用安全工作奠定了基础,还为早期的API客户开发了许多新颖的解决方案。

在GPT-4发布后,我被要求承担新的挑战,重新考虑OpenAI的安全系统愿景,并将所有工作集中到一个负责整个安全体系的团队。

这是我经历过的最困难、最紧张又令人兴奋的事情之一。如今,安全系统团队拥有超过80位出色的科学家、工程师、项目经理、政策专家,我为我们作为一个团队所取得的一切成就感到极为自豪。

我们见证了每次发布的核心——从GPT-4及其视觉和Turbo版本,到GPT Store、语音功能以及01版本。我们在训练这些模型以达到负责任和有益的目标上设立了新的行业标准。

苹果或推出iphone14plus上市时间

我特别为我们最新的成就o1预览版感到自豪,它是我们迄今为止最安全的模型,展现了出色的抗破解能力,同时保持了模型的有用性。

我们的集体成就令人瞩目:

  • 我们训练模型如何处理敏感或不安全的请求,包括何时拒绝或不拒绝,并通过遵循一套明确的模型安全行为政策,达成安全与实用之间的良好平衡。

  • 我们在每次模型发布中提升了对抗性鲁棒性,包括针对破解的防御、指令层次结构,并通过推理大幅增强了鲁棒性。

  • 我们设计了严格且富有创意的测试方法,使模型与《准备框架》保持一致,并为每个前沿模型进行了全面的安全测试和红队测试。

  • 我们在详细的模型系统卡中强化了对透明性的承诺。

  • 我们开发了业内领先的审核模型,具有多模式能力,并免费向公众共享。我们当前在一个更通用的监控框架和增强安全推理能力的方向上工作,将赋能更多的安全工作流。

  • 我们为安全数据日志、度量、仪表盘、主动学习管道、分类器部署、推理时间过滤以及一种新的快速响应系统奠定了工程基础。

回顾我们所取得的成就,我为安全系统团队的每一个人感到无比自豪,并极为确信这个团队将继续蓬勃发展。我爱你们。

翁仲百科

在OpenAI的七年之后,我准备好重新出发,探索一些新的领域。OpenAI正沿着火箭般的轨迹前进,我衷心祝愿这里的每一个人一切顺利。

附注:我的博客将继续更新。我或许会有更多时间来更新它 & 可能也会有更多时间编写代码 。

爱你们的,

Lilian

铁打的OpenAI,流水的安全主管

自OpenAI成立以来,安全主管这个关键职位历经多次更替。

最早在2016年,OpenAI的安全主管由达里奥·阿莫代伊(Dario Amodei)担任,在他的领导下,安全系统团队专注于减少现有模型和产品的滥用风险,尤其是围绕GPT-3的安全性开展了深入研究。

阿莫代伊主导了GPT-3的全面安全评估,以确保模型在发布前经过严格的安全测试和评估,最大限度地降低潜在的滥用风险。

他在OpenAI的工作为后来人工智能的安全治理奠定了重要基础。

翁仲百科

2021年,阿莫代伊离开OpenAI创立了Anthropic公司,继续致力于人工智能的安全研究,推动构建更具可信度和安全性的AI模型。

在阿莫代伊之后,还有短暂任职2个月的安全主管,亚历山大·马德里(Aleksander Madry)。

他在职期间主要聚焦对新模型的能力进行评估,并开展内部红队测试,以识别和缓解潜在的安全风险。

虽然他的任期较短,但他在红队测试和威胁预测上的重要推进,为OpenAI的安全实践提供了新的视角和方法论。

在2023年7月后,马德里转而专注于“AI推理”方面的工作,离开了安全主管的职位。

在他之后的第三位安全主管,则是杨·莱克(Jan Leike),在2023年7月至2024年5月担任这一职务,和Ilya一起领导“超级对齐”项目,目标是在四年内解决超智能AI的对齐问题。

在此期间,杨·莱克推动了使用小型模型监督和评估大型模型的研究,开创了对超人类能力模型进行实证对齐的新方法。

这种方法对于理解和应对高级人工智能模型的行为具有深远影响。

然而,由于与公司在安全和产品优先级上的分歧,杨·莱克于2024年5月宣布离职。

尽管如此,他在对齐研究方面的贡献,为后续人工智能的可控性研究奠定了理论和实践基础。

而翁荔则是于2024年7月担任OpenAI安全主管。

关于翁荔

翁荔是OpenAI华人科学家、ChatGPT的贡献者之一,本科毕业于北大,在印第安纳大学伯明顿分校攻读博士。

毕业之后的翁荔先是短暂的在Facebook实习了一段时间,第一份工作则是就职于Dropbox,担任软件工程师。

她于2018年加入OpenAI,在GPT-4项目中主要参与预训练、强化学习和对齐、模型安全等方面的工作。

在OpenAI去年底成立的安全顾问团队中,翁荔领导安全系统团队(Safety Systems),解决减少现有模型如ChatGPT滥用等问题。

翁荔在Google Scholar的引用量也达到了13000+次。

翁忛简介

此前她提出的提出LLM外在幻觉(extrinsic hallucination)的博文也是非常火爆。

翁荔重点关注外在幻觉,讨论了三个问题:产生幻觉的原因是什么?幻觉检测,抵抗幻觉的方法。

关于研究的细节,可以点击这里查看:万字blog详解抵抗办法、产幻原因和检测方式。

至于翁荔离职后的去向,量子位也会保持持续的关注。

参考链接:

[1]https://x.com/lilianweng/status/1855031273690984623

[2]https://www.linkedin.com/in/lilianweng/

—完—


返回网站首页

本文评论
中国移动与中国一汽举行“AI+行动”专项战略合作签约_一汽移动出行事业部宋明君
中国移动与中国一汽举行“AI+行动”专项战略合作签约 通信产业网|2024-07-17 16:13:34作者:通文来源:通信产业网【通信产业网讯】7月16日,中国移动通信集团有限公司与中国第一...
日期:07-24
工信部:我国工业互联网进入规模化发展新阶段_中国工业互联网现状
通信世界网消息(CWW)2023年是全面贯彻落实党的二十大精神的开局之年,是三年新冠疫情防控转段后经济恢复发展的一年,也是我国工业发展史上具有里程碑意义的一年。1月19日,国新办举...
日期:01-23
天猫精灵模块「天猫精灵宣布“精灵大模型”已全面上线」
10月23日 消息:天猫精灵“精灵大模型”现已全面上线,带来四大升级技能,包括开放域对话和AIGC创作功能的优化、解决就近唤醒问题以及支持音色切换。具体来说,天猫精灵的“精灵大...
日期:10-23
“绝世好男人”VS“旋风孝子” 京东国际告诉你这届消费者最爱买什么
  最舍得海淘花钱的80后和最热衷跨国买买买的90后已经成为中国进口商品消费的核心主力;来自希腊、西班牙、阿联酋等小众国家的商品已经开始撬动美国、日本、韩国的蛋糕;...
日期:11-23
百度发布MV简单之风吹满地 称捍卫度厂文化
5月11日 消息:百度公司今日再次展现出其深厚的文化底蕴与积极向上的精神风貌。通过其工会联合会视频号“百度同学”发布的MV《简单之风吹满地》,百度不仅唱响了“捍卫度厂文...
日期:05-11
不怕被骗了!TikTok成为全球首个自动标记AI生成内容的社交媒体平台_tiktok自动化软件
快科技5月12日消息,TikTok本周宣布,将对所有AI生成内容、视频、图片进行自动标记,以防止混淆和误导观众。杭钢股份前十大股东携号转网难不难一年多以来,使用TikTok的AI创作工具...
日期:05-12
顺丰顾客满意度「15连冠!顺丰再获第一 快递服务满意度创历史最好水平」
快科技4月8日消息,国家邮政局通报2023年快递服务满意度调查和时限测试结果。在9家品牌中,顺丰继续位居快递服务公众满意度得分排名首位,这是顺丰连续第15年在国家邮政局快递服...
日期:04-09
超能实力,全芯旗舰!汇顶科技携手vivo开启超声波指纹普及新时代
通信世界网消息(CWW)5月13日,vivo X100系列影像新旗舰震撼发布。汇顶科技自主知识产权的超声波指纹方案首发搭载于X100 Ultra,凭借创新架构与自研算法,带来流畅解锁的满分体验。...
日期:05-14
真我v3是游戏手机吗「真我V30成为热销爆款的背后,5G 普及进行到哪里了?」
5G 商用 4 年,每个人都用上 5G 了吗?答案是否定的。华为新机p60多久发布近年来,我国 5G 套餐用户数量仍在快速增加。中国移动、中国电信与中国联通相继公布的 2023 年 1 月份运...
日期:04-21
日本核污水排海 韩国居民疯狂抢购食盐 网友:今夕是何年_日本将核污水排入大海韩国反应
7月11日消息,因为日本准备将100多万吨核污水排入海洋,韩国消费者开始抢购海盐等物品 。由于韩国民众恐慌性抢购还导致韩国6月份食盐价格较两个月前上涨27%。在7月11日之前,韩国...
日期:07-12
45岁洁柔的霸总私域路线_洁柔总裁
声明:本文来自于微信公众号见实(ID:jianshishijie),作者:谢萌 高祥容,授权转载发布。“你们有看到今天私域运营中一些新的玩法,新的趋势吗?”“其实我们就在试图探索一条不止于GM...
日期:10-26
国产芯片vs“国际水平”,有距离也有超越!_国产芯片质量怎么样
当前,国产芯片正在迎来全新的发展阶段。国产终端芯片性能怎么样,与国际主流产品相比,表现如何?今天笔者就针对目前热度较高的四款国产CPU进行参数分析与性能跑分横向对比。此次...
日期:10-19
华为颠覆性产品会是什么!余承东:敢说遥遥领先 是我们真领先太多才说
快科技12月11日消息,据国内媒体报道称,余承东在华为花粉年会上回应被网友调侃的遥遥领先”,称自己一场发布会有时最多有一个遥遥领先,甚至有时一个都没有,只有领先比较多的时候...
日期:12-11
「iCloud+云空间首次向合作伙伴会员权益开放 「京东与Apple深化合作」」
来源:中关村在线如今,消费者在选购Apple产品时,除了关注产品之外也同样会在各渠道之间对比,综合价格、品质、服务及体验等方面下单。为持续探索品牌与渠道之间的合作模式、不断...
日期:09-06
土豆网开始和中移动再度联手推进无线视频UGC
  6月20日消息,近日,土豆网开始和中移动再度联手推进无线视频UGC(用户创造 内容)模式。   为此,土豆举办手机电影节“G客G拍”的展映,推出G客G拍——永不落幕的手机院线,通过...
日期:07-30
支付时代的变革「经济日报:支付十年 数字化浪潮中的支付变迁」
  2013年,上海的张先生来到浦发银行的ATM机,他要给远在北京上学的小张转生活费。插卡、输入密码、转账、24小时后,小张的招商银行借记卡将收到这笔转账款项。  2017年,小张...
日期:09-30
2023双11最强MiniLED!超大屏电视就选海信电视U8_海信u系列电视机什么价
随着显示技术的不断创新以及越来越优越的分辨率和色彩表达能力,大尺寸电视逐渐成为家庭电视的主流选择。在这一趋势中, 98 英寸以上电视以其震撼的视觉效果、细腻生动的色彩画...
日期:11-03
冰箱长期不清洁,竟然比马桶脏23倍?「冰箱不清洗的危害性」
  本文来自中国家电网    “ShangHai的热是把人丢进热水壶里煮,北京的热是把人丢进火化炉里焚烧。” “今年夏天的热是每天一出门都要感叹一句:怎么tnnd这么热,但是还得...
日期:07-14
比尔盖茨专访谈及马斯克:他不会听任何人意见 但还是希望他多关注气候变化
快科技7月22日消息,据媒体报道,在最近接受约翰弗拉尔(John Fraher)采访时,盖茨探讨了技术在缓解气候危机中的角色、人工智能的蓬勃兴起,以及埃隆马斯克可能为气候变化做出的贡献。...
日期:07-22
花光所有积蓄 美国老头把中国甲骨文搬上网络
  在家乡美国田纳西州,理查德·希尔斯是个完完全全的小人物。离婚、失业、独居,甚至过去的一个月里,因为花光了所有的积蓄,他一度陷入深深的绝望。   可在过去的半个月,在地...
日期:07-26