您的位置:首页 > 互联网

OpenAI语音转录工具被曝严重幻觉:转录100小时,一半儿在瞎扯_语音转录是什么意思

发布时间:2024-10-28 09:54:56  来源:互联网     背景:

声明:本文来自于微信公众号 量子位,作者:西风,授权转载发布。

OpenAI的AI语音转写工具,那个号称近乎“人类水平”的Whisper,被曝幻觉严重——

100多小时转录,被工程师发现约一半都在瞎扯。

更严重的是,美联社还爆料有医疗机构利用Whisper来转录医生与患者的会诊,瞬间引发大量网友关注。

据悉,明尼苏达州的曼卡托诊所和洛杉矶儿童医院在内的超过30000名临床医生和40个卫生系统已开始使用法国AI诊疗公司Nabla基于Whisper打造的工具。

而且他们已经转录了大概700万次医疗就诊。

网友纷纷表示这就有点吓人了。

值得一提的是,OpenAI之前早就警告过,该工具不应在“高风险领域”中使用。

针对最新爆料,有OpenAI发言人回应,OpenAI会在模型更新中加入相应的反馈机制。

OpenAI被督促赶紧解决此问题

Whisper是OpenAI老早前推出的开源自动语音识别(ASR)系统,于2022年9月发布。

它采用简单的端到端方式,基于编码器-解码器Transformer架构。输入音频将被分成30秒的块,转化为梅尔倒谱(音频特征提取方式之一,log-Mel spectrogram),然后传入编码器。

经过68万小时的多语言和多任务监督网络数据的训练,Whisper可以进行多语言转录。

Whisper推出后得到广泛应用,如今GitHub已揽获70.2k标星:

据悉,它还被集成在ChatGPT的一些版本中,同时也是Oracle和微软云计算平台的一项内置服务,而这些平台为全球数千家公司提供服务。

此外,仅在上个月,HuggingFace上的一个最新版本Whisper就被下载了超420万次。HuggingFace社区的机器学习工程师Sanchit Gandhi表示,Whisper是最受欢迎的开源语音识别模型。

而现在,据美联社报道,很多研究人员和工程师反映,在工作中他们经常遇到Whisper产生的幻觉。

例如,密歇根大学的一位研究员在尝试改进模型之前,发现其检查的每10份音频转录中有8份出现了幻觉。

一位机器学习工程师指出,在他分析的超过100小时Whisper转录中,大约一半出现了幻觉。

还有一位开发者表示,在他使用Whisper创建的26,000份转录中,几乎每一份都发现了幻觉。

大数据技术在零售中发挥哪些作用

……

这种问题甚至存在于录制良好的短音频样本中。

在最近的一项研究中,计算机科学家们在审查的超过13000个清晰音频片段中发现了187个幻觉。

工程师和研究人员表示,他们从未见过其它任何AI驱动的转录工具像Whisper这样频繁地产生幻觉。

Whisper幻觉严重的原因目前尚未可知,但有软件开发者表示,这些虚构内容往往发生在停顿、有背景声音或音乐播放时。

之前,OpenAI就有提醒:

语音转录是什么工作

不要在决策情境中使用Whisper,准确性上的缺陷可能导致结果出现明显偏差。

然鹅,美联社表示,这一警告并未阻止一些医院或医疗中心使用Whisper等语音转文字模型——

包括明尼苏达州的曼卡托诊所和洛杉矶儿童医院在内,已经有超30000名临床医生和40个医疗系统已经开始使用由Nabla公司基于Whisper开发的工具。

Nabla CTO Martin Raison称,该工具针对医疗语言对模型进行了微调,用于转录和总结患者的交流。

目前,该工具已被用于转录约700万次医疗就诊。

LG G3手机

在得知Whisper可能会产生幻觉后,Nabla表示正在解决此问题,不过:

由于“数据安全原因”,Nabla的工具会删除原始音频,无法将Nabla生成的AI文本与原始录音进行比较。

此外,据了解,Whisper还被用来为聋人和听力障碍者创建字幕。

Whisper幻觉严重问题被发现后,有人敦促OpenAI赶紧解决此问题。

今年2月离开OpenAI的研究员William Saunders也开麦了:

如果公司愿意优先考虑,这似乎是可以解决的。如果你把它放出去,人们过于自信于它的功能,并将其集成到所有这些其他系统中,那就成了问题。

有OpenAI发言人回应称,公司持续研究如何减少幻觉现象,并感谢研究人员的发现,同时补充道OpenAI会在模型更新中融入相应反馈机制。

参考链接:

[1]https://apnews.com/article/ai-artificial-intelligence-health-business-90020cdf5fa16c79ca2e5b6c4c9bbb14

[2]https://x.com/AP/status/1850150400424345858

实时语音转录


返回网站首页

本文评论
Ivalua推出AI合同数字化和采购优化新平台
文章概要:1.Ivalua最推出新平台,该平台提供了多项功能来增强合同数字化,包括人工智能驱动的合同数据捕获、供应商风险管理等。2. 新的平台通过提高流程可见性、引入集中式视图...
日期:09-04
轻薄有型更会拍 vivo S7国美渠道预约享多重福利_vivo S7e体验:轻薄机身时尚美拍的5G手机
  ​日前,vivo正式发布vivo S7轻薄自拍旗舰手机。全新的S7系列在软硬件上大幅提升影像实力,新机在超薄机身内安置了4400万像素前置双摄,且支持PDAF自动对焦。产品拥有爵...
日期:07-14
湖北移动以科创擘画新质生产力 5G全连接工厂刷新工业企业产能_湖北移动工程公司
通信世界网消息(CWW)走进湖北允升科技5G全连接工厂,车间内智能化生产线飞速运转、全量大数据实时监测……在这个日产量达100万只锂电池的“5G智慧工厂”里,关键工序全部实现智能...
日期:04-07
第一财经:拿深圳高薪住长沙低价房 万兴科技拿出招揽人才杀手锏
  近日,第一财经发布报道《“拿深圳高薪住长沙低价房”,这类口号会让人才从沿海城市回流吗》。报道称近年来内陆城市吸引高端人才回流的举措越来越多。这也从侧面反映出,...
日期:07-16
光谷首张自动驾驶道路测试牌照发放点「光谷首张自动驾驶道路测试牌照发放」
12月20日,光谷首张“自动驾驶道路测试牌照”(鄂A0500试)正式发放。自动驾驶小巴该牌照由武汉市经信局、公安交管局、交通运输局及相关专家联合评审通过,由市公安交管局颁发,将用...
日期:12-22
京东开启员工福利新篇章:31亿元拿地或建设员工福利房「京东员工福利待遇 股权」
2月9日 消息:据证券时报报道2月8日,北京2022年的第五次集中供地圆满结束,总共有6块地,其中3块触顶、3块底价。6块地共收取了132.09亿元,总面积21.47万平方米,规划建筑面积53.18万...
日期:02-09
华为Mate60全球销量已破3000万台?网友沸腾了,但这是一个美丽的误会_华为mate60pro最新消息
众所周知,华为在没有预热的情况下直接上架开售Mate60系列,凭借着出色的产品竞争力引发了极高的市场热度,同时过于火爆的人气导致了长期供不应求,也因此许多网友对其销量表现十分...
日期:01-31
梭子鱼加速电子邮件安全解决方案发展战略_梭子鱼邮件安全网关
  云安全解决方案供应商梭子鱼网络于近期宣布其电子邮件安全业务在2019财年加速增长,已达到2亿美元的年营收运转率,其中梭子鱼Sentinel产品业务也显示在加速增长。作为该公...
日期:11-02
苹果10月发布会前瞻:新iPad和Mac必有_苹果发布会10月发布会产品
苹果即将在10月举办另一场发布会,除了MacBook Pro外,还有可能会有新款iMac、iPad和iPad Mini等产品发布。其中,M4芯片的升级是预料之中的,同时前置摄像头可能也会移至横向位置,而...
日期:09-15
小z照片打印机:让实体照片成为岁月的见证_小型照片打印机怎么用视频讲解
在这个瞬息万变的世界中,什么能帮我留住记忆,是一张张的照片,随着科技的发展,我们打印照片不需要去专业的冲印店依靠他人,一台可以连接手机的照片打印机就可以解决问题,而且自己动...
日期:06-07
春节期间流量高峰如何应对? 湖南联通推出“春节不停机”用户福利
  年与时驰,冬与日去,春节期间,用户通过手机上网娱乐、利用微信、视频等方式拜年成为新常态,用户的流量峰值也开始持续攀升。为确保2020年春节期间湖南省网络安全、顺畅运行,...
日期:05-06
价格跌至史上最低!iPhone15最高减1050元,苹果愁卖了?_苹果15目前最新价格
全文共1391字,阅读大约需要4分钟iphone12pro跌破发行价iPhone 15系列的降价幅度之大,堪称“跳水式”。2024年,苹果打响了手机市场“价格战”第一枪。距离苹果官网罕见大降仅两...
日期:01-18
索尼历年市值_索尼预测2011财年亏损206亿元 达16年来最高
(坎贝)北京时间5月23日消息,据国外媒体报道,由于日本311地震导致工厂减产以及在线娱乐服务遭黑客入侵的影响,日本最大消费电子产品出口商索尼预测的2011财年业绩低于分析师预期...
日期:07-28
Google安全_网秦发布严重安全警告  Google Android惊爆高危漏洞
  近日,网秦手机安全中心通过验证Google Android 2.1版本和部分2.2版本的机型,发现Android内核中存在一个高危漏洞。此漏洞可被普通能力的安装包利用,进而获取系统Root权限,...
日期:07-25
后互联网时代如何借势“审美”红利 应用宝《2019移动APP洞察报告》出炉
  在逐渐饱和的移动互联网市场,“颜值经济”成为APP厂商获取用户流量、实现商业变现的重要渠道。1月7日,腾讯应用宝发布的《2019移动APP洞察报告》显示,网民对美的需求在美...
日期:07-09
Stable Diffusion 3技术报告流出,Sora构架再立大功!生图圈开源暴打Midjourney和DALL·E 3?
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。【新智元导读】Stability AI放出了号称能暴打闭源模型的Stable Diffusion3的技术报告,采用DiT构架的新...
日期:03-06
电影热辣滚烫定档 2024春节档已官宣5部电影_热辣滚烫什么歌词
1月11日,贾玲执导的电影《热辣滚烫》宣布将于2月10日大年初一上映,并公布了主演阵容。这是贾玲继《你好,李焕英》后,时隔三年再度以导演身份回归春节档的作品。工信部同意开屏es...
日期:01-11
2024年诺贝尔经济学奖出炉:3名美国经济学家获奖_2021年诺贝尔奖经济学奖
快科技10月14日消息,据媒体报道,当地时间10月14日,瑞典皇家科学院宣布2024年诺贝尔经济学奖得主。MIT教授阿西莫格鲁、MIT教授Simon Johnson、芝加哥大学James A. Robinson获得...
日期:10-14
快递新业态:涨价、增收、筹钱(快递全面涨价)
索尼超广角变焦镜头推荐顺丰同城自动接单   价格战结束后,申通、圆通和顺丰等多家公司在提高单价的同时,也在多渠道加大资金储备。   文 | 张建锋; 编辑 | 王立峰   自2...
日期:08-16
硬刚苹果!超薄折叠手机荣耀Magic V2首销一机难求「荣耀magic3折叠屏」
硬刚苹果!超薄折叠手机荣耀Magic V2首销一机难求  【手机中国新闻】想要入手一款新上市的荣耀MagicV2,难度有多大?荣耀MagicV2  荣耀官方宣布,目前火热的折叠屏手机荣耀Magi...
日期:07-22