您的位置:首页 > 互联网

提示词缓存可减少50%输入token成本-OpenAI开发者大会推出四大创新

发布时间:2024-10-02 11:49:18  来源:互联网     背景:

【】10月2日消息,美东时间10月1日OpenAI举行了年度开发者大会DevDay,推出系列新工具,包括四大创新:实时API(Realtime API)、视觉微调(Vision Fine-Tuning)、提示词缓存(Prompt Caching)、模型蒸馏(Model Distillation),为开发者带来在降低模型成本、提高模型视觉理解水平、提升语音AI功能和小模型性能的新选择。在OpenAI官网主要,上述功能介绍已经做了全面更新,一起看看。

实时 API(Realtime API)

rtx4090与rx7900xt谁更强

OpenAI DevDay发布了Realtime API,目前处于公开测试beta阶段。

Realtime API 能够构建低延迟、多模式对话体验。它目前支持文本和音频作为输入和输出,以及函数调用。Realtime API 中的音频功能由新的 GPT-4o 模型“gpt-4o-realtime-preview”提供支持。

董明珠否认做手机失败

通过此更新,开发人员可以将任何文本或音频输入传递到 GPT-4o,并让模型以他们选择的文本、音频或两者做出响应。

本质上,Realtime API 简化了构建语音助手和其他对话式 AI 工具的过程,无需将多个模型拼接在一起进行转录、推理和文本到语音的转换。

Realtime API 定价方面,Realtime API 同时使用文本tokens和音频tokens。文本输入tokens的价格为5 美元/百万tokens,输出tokens的价格为20 美元/百万tokens。音频输入的价格为100 美元/百万tokens,输出的价格为200美元/百万tokens。这相当于每分钟音频输入约 0.06 美元,每分钟音频输出约 0.24 美元。

视觉微调(Vision Fine-Tuning)

OpenAI DevDay公布,OpenAI最新的大语言模型(LLM) GPT-4o 引入了视觉微调。此功能让开发人员可以自定义模型以获得更强大的图像理解能力,从而实现增强的视觉搜索功能、改进的自动驾驶汽车或智能城市的物体检测以及更准确的医学图像分析等应用。

视觉微调遵循与文本微调类似的过程——开发人员可以准备他们的图像数据集,然后将该数据集上传到Open AI的平台。他们可以用少至 100 张图像来提高 GPT-4o 在视觉任务中的性能,并使用更大量的文本和图像数据来提高性能。

OpenAI举例称,东南亚食品配送和拼车公司Grab已经利用这项技术改进其地图服务。仅使用 100 个示例进行视觉微调,教会 GPT-4o 正确定位交通标志并计算车道分隔线以优化其地图数据,结果,与基础 GPT-4o 模型相比,Grab 能够将车道计数准确度提高 20%,限速标志定位率提高13%。

价格方面,截至 2024年10月31日,OpenAI每天免费提供100万tokens,以使用图像微调 GPT-4o。2024 年 10 月 31 日之后,GPT-4o 微调训练将花费每 100 万tokens 25 美元,推理将花费每 100 万个输入tokens 3.75 美元和每 100 万个输出tokens 15 美元。图像输入首先根据图像大小进行标记,然后按与文本输入相同的每令牌费率定价。

提示词缓存(Prompt Caching)

提示词缓存被视为本次DevDay发布的最重要更新。该功能旨在降低开发者的成本、减少延迟。

许多开发人员在构建 AI 应用程序时,会在多个 API 调用中重复使用相同的上下文,例如在编辑代码库或与聊天机器人进行长时间的多轮对话时。今天,我们推出了提示词缓存(Prompt Caching),让开发人员可以降低成本和延迟。通过重复使用最近处理的输入token,开发人员可以获得 50% 的折扣和更快的提示词处理时间。

目前,提示词缓存(Prompt Caching)已自动应用于最新版本的 GPT-4o、GPT-4o mini、o1-preview 和 o1-mini,以及这些模型的微调版本。与未缓存的提示相比,缓存的提示可享受折扣。

模型蒸馏(Model Distillation)

如何拆解airpods pro

OpenAI 推出了一款新的模型蒸馏产品,为开发人员提供集成的工作流程,以直接在 OpenAI 平台内管理整个蒸馏流程。

这让开发人员可以轻松使用前沿模型(如 o1-preview 和 GPT-4o)的输出来微调和提高更具成本效益的模型(如 GPT-4o mini)的性能,让小模型也可拥有尖端模型功能。

 这种方法让小公司也可能利用与尖端模型类似的功能,并且无需承担使用这类模型的计算成本。例如一家从事医疗技术的小型初创公司要为农村的诊所开发一种AI 驱动的诊断工具。使用模型蒸馏,该公司可以训练一个紧凑的模型,该模型可以捕捉大模型的大部分诊断能力,同时只需要在标准的笔记本电脑或平板电脑上运行。 


返回网站首页

本文评论
三星r439_三星r439笔记本内存
是一个笔记本电脑系列,代表了三星在轻便、高性能笔记本电脑领域的一种设计理念。该系列的特点是轻薄便携,但性能却出色,性价比极高。下面我们将从外形设计、硬件配置、性能表现...
日期:06-04
优惠500元,华为智能手表双11选购一图看懂_华为手表表盘打折
中关村在线消息:双11已到,读者朋友们有没有选购智能手表的打算?好消息是,华为智能手表全系列都有优惠,最高优惠500元。具体详情,一图看懂——手机公司造汽车realme磁吸充电器可以...
日期:10-31
淘宝商城推迟2012年度协议新签及续签工作
  10月17日消息 10月17日,淘宝商城发布公告称,原定于2011年10月17日启动的淘宝商城2012年度协议新签及续签工作,因故延期。   淘宝商城对商城用户发出提醒,原定于2011年10...
日期:07-24
居民在5楼阳台养7头小牛被投诉:并非宠物、很招蚊蝇「楼房养牛」
见过在城市房子里养猫、养狗,甚至是养一些其他动物来当宠物的,但你见过在楼上养牛的吗,而且一次性养了7头!据媒体报道,近日在四川南充顺庆潆凤花园小区,一小区有居民在五楼阳台养...
日期:07-15
谷歌更改部分搜索广告显示位置以提高收入(谷歌广告附加信息)
  北京时间11月4日凌晨消息,谷歌已从周三开始将部分广告放在搜索结果下方而非旁侧,认为此举将可为其带来更多收入。   虽然作出了这种改变,但谷歌搜索结果右侧的广告栏仍...
日期:07-24
微信视频号爆粉「官方发视频号爆单指南了!」
声明:本文来自于微信公众号 见实(ID:jianshishijie),作者:见实,授权转载发布。在上次的微信公开课上,微信透露,2023年视频号带货GMV规模相比2022年有3倍增长,订单数量增长了244%+。...
日期:01-29
我国发布全球首个海底智算中心平台!总算力超过2000PFlops 用海水散热
快科技4月18日消息,据央视新闻报道,近日我国在海南海口正式发布了全球领先的海底智算中心平台。这也是全球首个海底智算中心平台,依托海南陵水国际海底光缆(登陆站)优势建设,项目...
日期:04-18
ie市场占有率_IE浏览器4月份市场份额55.1% 创12年来最低值
  据国外媒体报道,互联网流量监测机构Net Applications最新发布的统计数据显示,今年4月份谷歌Chrome浏览器的市场份额已升至11.94%,高于今年3月份的11.57%。Net Application...
日期:07-27
丰田电动汽车销量「丰田计划在2026年之前推出10款电动汽车 每年卖150万辆」
4月7日消息,日本汽车制造商丰田计划在2026年之前推出10款新电动汽车,并将销量目标定为每年150万辆。丰田希望在电动汽车市场中取得领先地位,目前公司在该市场长期落后于竞争对...
日期:04-07
跨海“飞行出租车”来了!单座票约300元 2026年开启载人飞行_飞行出租车机场
快科技3月9日消息,近日,电动垂直起降航空器(eVTOL)盛世龙”从广东深圳蛇口邮轮母港起飞,经过约20分钟的飞行,降落在珠海九洲港码头。这是全球首条跨海跨城电动垂直起降航空器航线...
日期:03-09
AMD宣布全新驱动技术!RX 7000 HYPR-RX性能飙升50%「amd r7 200 series驱动」
RX 7800 XT、RX 7700 XT两款新卡将于9月6日解禁开卖,而就在同一天,AMD还会发布全新的Adrenalin显卡驱动,支持新卡的同时,还带来新的性能、功能。新驱动将首次集成HYPR-RX技术,用...
日期:08-29
上线8年 京东众筹将于10月10日起业务停运_京东众筹面临的风险
10月9日 消息:日前,京东众筹发布公告称,京东众筹业务将于2022年10月10日起暂停运营。9月30日10点,京东众筹入口下线,已经上线的项目将继续众筹,成功后正常发货。10月10日,众筹业务...
日期:10-23
真凉了!暴雪网易闹掰 《炉石传说》或被移出杭州亚运会项目「炉石传说入选亚运会」
暴雪与网易闹掰后,包括《炉石传说》《魔兽世界》《风暴英雄》《星际争霸》等多款暴雪游戏宣布国服停运。今日,据人民电竞”爆料,由于暴雪娱乐和网易未能续约,所有中国大陆炉石传...
日期:03-16
40斤蟒蛇爬进派出所110求助119 系国家二级保护动物_蟒蛇在中国是几级 保护动物
“我们这里出现了一条很大的蟒蛇,太大了,我们有点不敢接近。”6月3日,云南西双版纳边境管理支队打洛边境派出所的一名民警正在办公室工作,突然一条大蟒蛇从外面爬了进来,这让民警...
日期:06-06
李彦宏:文心一言对标ChatGPT门槛很高,百度在全球大厂中第一个做出来
3月16日下午消息,百度于北京总部召开新闻发布会,主题围绕新一代大语言模型、生成式AI产品文心一言。百度创始人、董事长兼首席执行官李彦宏出席及百度首席技术官王海峰出席,并...
日期:03-16
小鹏汽车发布第三季度财报 总营收68.2亿元「小鹏汽车发布第三季度财报 总营收68.2亿元是真的吗」
11月30日 消息:小鹏汽车今天公布了其2022年第三季度未经审计的财务业绩。thinkpade14酷睿版最新iphone 14曝光!全新重大改变数据显示,小鹏汽车第三季度营收68.32亿元同比增长...
日期:12-02
「新性能标杆呼之欲出,全大核天玑9300已完成LPDDR5T性能验证」
来源:中关村在线据中关村在线了解,SK海力士近日在官网宣布,其LPDDR5T移动DRAM已在联发科下一代天玑旗舰移动平台上完成性能验证,速率高达9.6Gbps。容联云竞争对手其实早在今年1...
日期:09-03
御湘湖四周年:开启数智健康管理新元年_杭州御湘湖健康产业管理有限公司
(原标题:御湘湖四周年:开启数智健康管理新元年) 随着人口老龄化趋势加快以及经济社会的发展,人们对健康的需求前所未有地增长,健...
日期:11-02
两用户在抖音中相互谩骂毁名誉 法院:应相互赔礼道歉「抖音评论负法律责任吗」
12月9日 消息:据西平法院消息,近期,河南省西平县人民法院审结了一宗名誉权纠纷案件。夏某、杜某均系“抖音” 软件用户,二人曾分别与“某大哥”系网络好友,“某大哥”曾将其个人...
日期:12-10
已经跑出千万月流水,Playrix赌到三消下一个王炸?_playrix团队努力为您制作更好玩的游戏
声明:本文来自微信公众号“白鲸出海”(ID:baijingapp),作者:白鲸小编,,授权转载发布。由于全球经济下行、加之前两年疫情推动游戏行业快速增长,近两年全球游戏产业规模整体回落。da...
日期:01-16