您的位置:首页 > 互联网

UNC斯坦福等推出通用修正器LURE 多模态物体幻觉下降23%

发布时间:2023-11-06 18:01:57  来源:互联网     背景:

要点:

1. 多个大学的研究人员开发了名为LURE的通用修正器,旨在解决多模态大模型中的物体幻觉问题,降低幻觉频发的三个成因。

2. LURE通过对幻觉产生的关键因素进行统计分析,包括物体共现、不确定性和物体位置,有效减少幻觉问题。

3. LURE在多个开源多模态大模型上进行了评估,显示通用物体幻觉评估指标提高了23%以上,有效降低幻觉问题。

11月6日 消息:一项由北卡教堂山、斯坦福、哥大、罗格斯等大学的研究人员合作开发的通用修正器LURE已经面世,旨在应对多模态大模型中出现的物体幻觉问题。这些幻觉问题包括物体共现、不确定性和物体位置,这些问题会对视觉摘要、推理等任务产生负面影响。LURE的设计基于对这些幻觉产生的关键因素进行严格统计分析。

论文地址:https://arxiv.org/abs/2310.00754

代码地址:https://github.com/YiyangZhou/LURE

在研究中,研究人员首先对幻觉问题的三种成因进行了深入分析。他们发现大多数幻觉描述中的物体在训练数据中通常共现,这意味着幻觉物体往往是一起出现的物体。此外,幻觉物体通常是在解码过程中不太确定的物体,这种不确定性会导致模型选择错误的物体。最后,研究人员还观察到,幻觉通常出现在生成文本的后半部分,这可能是前面的输出触发了后续幻觉的滚雪球。

为了解决这些问题,研究团队提出了LURE,这是一种多模态幻觉缓解方案。LURE可以与任意多模态大模型无缝衔接,对不准确的描述进行纠正。在多个开源多模态大模型上进行了评估,结果显示LURE显著降低了幻觉问题,通用物体幻觉评估指标提高了23%以上。此外,LURE还经过人工评估和GPT评估,一直名列前茅,显示了其有效性。

骁龙765g安卓11

总之,LURE是一项有望解决多模态大模型中幻觉问题的重要工具,通过对关键因素的分析和修正,为这些模型提供更准确的输出,有望在多领域的人工智能应用中产生积极影响。

无人驾驶前途

特斯拉semi上市时间


返回网站首页

本文评论
快更新!新版鸿蒙OS 3发布,华为Mate 50性能暴增「华为鸿蒙系统50」
今日,华为Mate 50系列近期推送了鸿蒙OS 3.0.0.302版本更新,更新包大小约为336MB。根据更新日志,此次更新主要优化了系统性能和部分场景操作体验,并改善了部分应用的使用体验。骁...
日期:05-05
巨量算数:2022年抖音母婴行业搜索内容量级同比增长93.4%「2021抖音用户量多少亿」
2月6日 消息:巨量算数发布《趋势雷达-2022抖音母婴行业年度盘点》报告,对2022年全年的抖音母婴行业快速盘点,透过平台数据分析,洞悉全年网络母婴内容生态,预测行业趋势。AMD最新...
日期:02-07
苹果发布App“一年之最”:最受欢迎的外卖、滤镜、电视剧
  12月31日消息 12月30日,苹果App Store发布了《App里的一年之最》,分别从旅行、社交、摄影等方面,选择了2019年一些包括美团、快手、知乎、腾讯视频、爱奇艺等各领域最具代...
日期:10-14
传苹果有意收购AMD:准备与英特尔分道扬镳(amd和英特尔和苹果)
  北京时间11月14日消息,据国外科技网站Techeye报道,一位不愿透露姓名的业界观察人士透露,苹果有意收购AMD,从而为与英特尔的分道扬镳做好准备。   该人士表示,苹果和英特尔...
日期:07-24
40周年感恩季献礼中秋!老板电器邀你共度佳节(中秋节谢谢老板的礼物)
  一年一度的中秋佳节即将到来,三天小长假也即将送达。天上月圆,人间团圆。很多人都选择回家与家人相聚,与家人一起品尝月饼和赏月,共享团圆时光。   年年中秋,年年都是一...
日期:03-08
苹果公布2019精选应用和游戏:年度游戏《光·遇》由华裔开发(光遇游戏安卓和苹果)
  12月3日消息 今天苹果在纽约正式公布了2019年精选App和游戏,其中年度精选游戏《光·遇》是由华裔开发者陈星汉带领团队开发。   iPhone部分的2019年精选App大奖由《S...
日期:02-18
阿里处罚口罩_阿里再发最严口罩禁令:让疫情期间作恶者倾家荡产
  2月5日下午消息,阿里巴巴平台治理部再次发布“最严口罩禁令”。这份面向全体商家的公告重申,平台持续从严从重打击制售假冒伪劣防疫用品的行为,对问题口罩和违规卖家“零...
日期:08-25
苹果哪个产品成本最高_苹果下一代iPhone材料成本或高达250美元
  市场研究公司UBM TechInsights称,苹果下一代iPhone材料成本为169美元至175美元,高于3GS版iPhone的156美元。   上述估计假设下一代iPhone配置16GB闪存,配置64GB闪存的下...
日期:07-29
上百人进山挖黄金?官方:挖的是昆虫 当地人称为“土黄金”「农村挖出黄金」
近日,有网友上传视频称大批人员进山寻金,引起网友热议。极目新闻记者调查发现,视频拍摄地点在江苏省连云港市东海县安峰镇安峰山。4月6日,安峰镇人民政府工作人员向极目新闻记者...
日期:04-06
知网又被罚,这次是为啥?「知网不好使了」
出品|虎嗅ESG组作者|王静编辑|袁加息头图|视觉中国本文是#ESG进步观察#系列第048篇文章本次观察关键词:数据安全、隐私保护知网又出问题了,这次被罚5000万。最近,国家互联网信息办...
日期:09-07
郑州海滩街:一条北方“网红路”的浮沉三年_郑州网红街道
声明:本文来自于微信公众号 刺猬公社(ID:ciweigongshe),作者:弋曈,授权转载发布。提起郑州,交通枢纽、中原粮仓,很多人除此之外再无其他印象。与同样是新一线城市的长沙、西安相比,郑...
日期:02-05
国家计算机病毒应急中心发布《美国NSA网络武器“饮茶”分析报告》
  今天,国家计算机病毒应急中心发布《美国NSA网络武器“饮茶”分析报告》,详情如下:  一、概述  国家计算机病毒应急处理中心在对西北工业大学遭境外网络攻击事件进行调...
日期:09-13
亚马逊加入生成式 AI 竞赛:借助 Bedrock 推出大语言模型 Titan
4月14日消息:亚马逊于 AWS 官网宣布推出 Amazon Bedrock 服务和 Amazon Titan 大语言模型。亚马逊正在推出一项名为 Bedrock 的云服务,开发者可以用能够生成文本的人工智能系...
日期:04-14
脸书旗下WhatsApp泄露海外近5亿用户的电话号码_脸书收购whatsapp
11月25日 消息:Cybernews发现某黑客在论坛上公开出售84个国家的4.87亿 WhatsApp 用户的电话号码。vertu手机 性能为什么说vivo x fold折叠屏不简单王传福商业理论realme9a是...
日期:11-28
人工智能专家对马斯克联名公开信的回应:散布恐慌和炒作 AI_马斯克担心人工智能言论
4月3日消息:日前埃隆·马斯克 (Elon Musk) 联名签署的一封公开信中引用了四位人工智能专家的研究成果,公开信要求紧急暂停研究,他们对此表示担忧。这封日期为 3 月 22 日的信,...
日期:04-03
骁龙8 gen3跑分曝光:177万傲视群雄
预计将于10月24日发布的高通骁龙8 gen3迎来新的曝光信息,搭载这款处理器的工程机跑分曝光,安兔兔V10版本的跑分达到177万分,远超骁龙8gen2的132万分和天玑9200 的135万分。根据...
日期:06-13
百度技术沙龙第十九期:持续交付让开发与运维合二为一
  在互联网这样一个竞争激烈的行当里,机会稍纵即逝,产品的开发周期和上线时间往往决定企业的竞争力。令人尴尬的是,开发和运维总是“敌对”的面孔,运维人员经常认为开发团队...
日期:07-24
字节跳动收购美中宜和,互联网大厂布局私立妇儿医院意欲何为?
黑客攻击学校系统Windows 11优化2021爱分析·数据智能平台厂商全景报告   近日,字节跳动完成对高端私立妇儿医院美中宜和的全资收购。   天眼查信息显示,6月24日美中宜和...
日期:08-11
“非洲之王”发力桌面市场!传音或将推出迷你主机MegaMini_传音进入非洲市场
在诸多国产手机厂商中,主攻非洲市场,被称为非洲之王”的传音,绝对是其中最特殊的一个。快科技9月1日消息,近日,根据91Mobile消息,传音计划在手机业务之外,开始乏力桌面市场,推出迷你...
日期:09-02
旧手机卖之前怎么样能防止数据泄露「卖旧手机又不想泄露数据,只恢复出厂设置可不行」
较真要点01仅通过手机恢复出厂设置不能保障信息安全,稳妥的办法是在手机恢复出厂设置并重启后,通过多次拷贝视频、下载软件等方式,把原有手机存储内存占满,覆盖掉原有数据,然后再...
日期:09-15