您的位置:首页 > 互联网

中国研究人员推ImageBind-LLM:通过ImageBind实现LLM的多模态指令调优方法_多模态代码

发布时间:2023-09-18 23:50:53  来源:互联网     背景:

文章概要:

- 中国研究人员最近取得了在大型语言模型(LLM)指令调整领域的显着进展。

- ImageBind-LLM是一种多模态指令调优方法,通过ImageBind进行大型语言模型的微调,能够响应多种形式的输入指令。

- 该模型使用视觉语言数据来调整多模态指令,特别建议仅使用视觉语言数据进行调整。

9月18日 消息:研究人员最近在大型语言模型(LLM)的指令调整方面取得了令人瞩目的进展。这一发现对于提高通用语言模型的性能和多模态指令响应能力具有重要意义。

图源备注:图片由AI生成,图片授权服务商Midjourney

虽然通用语言模型如ChatGPT和GPT-4在语言和视觉理解方面已经取得了显著进展,但由于闭源限制,它们仍然无法实现完全的复制。因此,研究人员提出了一种使用自行生成的数据来修改可公开访问的LLaMA(语言指令模型)的方法,以解决这一问题。

为了实现多模态指令调优,研究人员推出了ImageBind-LLM,这是一种通过ImageBind进行大型语言模型的微调的方法。本研究来自上海人工智能实验室、香港中文大学MMLab和vivo AI实验室的作者介绍了ImageBind-LLM多模态指令跟随模型,该模型在预训练的ImageBind中的联合嵌入空间的方向下有效地微调LLaMA。

与之前的视觉指令模型不同,ImageBind-LLM可以响应多种形式的输入指令,而不仅仅是图片。这意味着它具有更好的可扩展性和泛化能力。

ImageBind的关键在于其图像对齐多模态嵌入空间,因此研究人员建议仅使用视觉语言数据来调整多模态指令。对于图片-标题对,他们首先使用ImageBind的冻结图像编码器提取全局图像特征,然后使用可学习的绑定网络进行嵌入转换。这些转换后的图片特征随后应用于LLaMA中的所有转换器层单词标记,从而创建了用于生成适当文本标题的视觉上下文。与之前的零初始化注意力机制不同,他们的视觉注入机制更加简单,并通过可训练的零初始化门控因子进行加权。

多模态nlp

此外,研究人员还提出了一种基于视觉缓存的方法,用于在推理过程中进行嵌入增强,以解决图像训练和文本、音频、3D或视频条件下的模态差异。这个缓存模型包括了由ImageBind检索的训练数据集中的数百万图片特征,通过获得可比较的视觉特征(Tip-Adapter),提升了文本/音频/3D/视频嵌入的质量。这意味着对于多模态指令的口头回应质量更高。

amd zen4发布时间

ImageBind-LLM展示了四个关键特点:

1. 支持多种模式的指令,包括图片、文本、音频、3D点云和视频。

2. 实现了高效的调优方法,包括图像编码器冻结和参数高效方法的使用。

image模块

3. 使用可学习的门控方法进行渐进性知识注入,更为高效。

4. 提供了来自图像特征的视觉缓存模型,用于增强嵌入以解决训练和推理之间的模态差异。

这项研究的成果为大型语言模型的多模态指令响应能力提供了新的方法和思路,具有重要的实际应用潜力。

项目网址:https://github.com/OpenGVLab/LLaMA-Adapter

多模态代码

论文网址:https://arxiv.org/abs/2309.03905


返回网站首页

本文评论
公众号文章阅读量怎么挣钱「公众号阅读数暴跌!2023年怎么做自媒体赚钱?独家干货!」
声明:本文来自于微信公众号 运营公举小磊磊(ID:gongjulei),作者:运营公举小磊磊,授权转载发布。一个没有争议的事实,公众号越来越难做了。尤其是订阅号,阅读数,转发数都断崖式下滑...
日期:02-10
百度百家号整治自媒体乱象 打击“自媒体”违规营利行为_百家号自媒体平台官网
5月25日 消息:近日,百家号宣布开展“清朗·从严整治‘自媒体’乱象”专项行动。百家号称,将对以下三大类违规行为进行重点治理:穷人和富人的教育差距苹果14的5G基带是X60还是X...
日期:05-25
分手了会删朋友圈吗?微信小技巧一招教会你「分手后删朋友圈」
今天有一个热搜是分手了会删朋友圈吗?这个话题大家在讨论分成了两组。一组认为即使分手也要把曾经的美好记忆留下来,或者分手以后再复合删除了可就恢复了。另外一组认为,既然分...
日期:10-18
今晚执行!国内成品油价将迎三连跌:回吐之前涨幅 油价回年初水平
12月19日24时(也就是今天),国内成品油新一轮调价窗口将开启。机构普遍预计,国内成品油价将迎来三连跌”。据梳理,今年以来,国内成品油价格已经进行了23轮调整,呈现13涨9跌1搁浅”格...
日期:12-19
元宇宙手机开售:2700元买骁龙695?
HTC 的元宇宙手机Desire 22 Pro在发布之后终于开售,从7月1日开始,HTC Desire 22 Pro上市,售价11990新台币,约2700元人民币。不过这款手机的配置并不高,搭载高通骁龙695处理器,配备...
日期:08-01
理想汽车成为首家达成40万辆交付的新势力车企「理想汽车成为首家达成40万辆交付的新势力车企」
7月5日 消息:理想汽车公布数据称,近期于北京交付中心完成了第40万辆车的用户交付。成为首家达成40万辆交付的新势力车企。理想汽车表示,2023年上半年,理想汽车向用户共计交付新...
日期:07-05
谷歌AI研究提出利用大语言模型生成个性化文本通用方法_谷歌自然语言处理模型
本文概要:1. 使用多阶段多任务结构,包括检索、排序、摘要、合成和生成,训练法学硕士进行个性化文本生成。2. 引入辅助任务来提高大型语言模型的阅读能力,通过识别文本作者来改...
日期:08-22
苹果极大概率9月12日周二举办iPhone」-15系列发布会 「古尔曼_苹果9月15日发布会猜想
8 月 9 日消息,彭博社的马克・古尔曼日前预估,苹果将于今年 9 月 12 日星期二或 9 月 13 日星期三举行秋季新品发布会;在今天发布的推文中,他认为苹果极大概率会在 9 月 12 日召...
日期:09-18
斗鱼第二季度营收18.3亿元 净利润2350万元(斗鱼二季度财报)
查看最新行情   讯 北京时间8月15日下午消息,斗鱼(Nasdaq:DOYU)今日发布了截至6月30日的2022年第二季度财报。财报显示,斗鱼第二季度总净营收为18.332亿元...
日期:08-17
团购行业虚假信息调查:跟风炒作 变革受阻_论团购现象
图为:市场研究公司comScore的数据显示,通过电子邮件获得Groupon或LivingSoial的团购信息的用户分别占60%和53%。(TechWeb配图) 据某团购网站副总裁透露,目前他正在犹豫下半年媒...
日期:07-28
30年来第三次易主 台积电将取代三星、Intel成为半导体一哥_三星半导体和台积电
全球半导体行业的排名可能又一次被颠覆,这一次上位一哥的是台积电,以全球最大的晶圆代工厂荣登第一,超越三星、Intel。从1992年起,Intel成为全球半导体市场的一哥,营业额领先其他...
日期:10-11
智云新产品「点燃创作梦想,智云打造36小时影像创作聚集地」
6月17日,由智云和尼康联合举办的智云“36小时影像创作大赛”首 次来到云南省大理白族自治州。大理以“月映苍山雪,下关风吹上关花。”著称,本届36小时影像创作大赛以“风动影起...
日期:06-29
图像识别更准确!尤洋团队最新研究:全新自适应计算模型AdaTape「自适应优化算法有哪些」
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。【新智元导读】谷歌最新提出的自适应计算模型,能够提升图像识别性能。自适应计算(adaptive computation...
日期:08-23
苏宁易购:双11以来门店家电订单量环比增长146%_苏宁易购近三年双十一销售额
10 月 28 日消息,苏宁易购数据显示,自双 11 开启以来,全国门店客流环比增长185%,门店家电订单量环比增长146%,其中洗烘一体机、节能热水器等暖冬升级类家电增幅较大,环比超135%。...
日期:11-03
酱香拿铁爆火:口味评价两极分化「拿铁酱latte」
9月5日消息,从9月4日开始,一款咖啡成为社交平台上的刷屏爆款”,许多人等待两三个小时才买到,这就是瑞幸咖啡与贵州茅台联手推出的酱香拿铁。这款酱香拿铁的口味究竟如何?从年轻人...
日期:09-06
4.49万欧起售 比亚迪海豹海外售价公布:四舍五入比国内贵1倍
快科技9月4日消息,在慕尼黑车展上,比亚迪旗下纯电车型海豹亮相,其价格也一同得到公布。海豹共提供2款,售4.49-5.099万欧元,约合人民币35.24-39.31万元,而纯电动海豹在国内起售价为...
日期:09-04
当区块链遇上地产,会产生怎样的变革?_当区块链遇上地产,会产生怎样的变革和机遇
从资本市场源源不断的项目融资,到老百姓茶余饭后的热门谈资……那么,到底什么是区块链?它与我们的日常生活有什么关联?区块链将如何给传统经济赋能?《链内参》将推出系列报道,...
日期:08-01
工程师将 ChatGPT 和机器狗 Spot 结合起来 以增强沟通能力
4月27日消息:在人工智能和机器人越来越流行的世界里,看到工程师如何推动界限,找到使这些机器更有用的新方式,总是非常令人兴奋的。这正是 Santiago 通过将 ChatGPT 与 Boston D...
日期:04-27
陌陌《2020陌生人社交行为报告》:近六成网友得到过陌生人的帮助
  提到“陌生”,你会联想到什么?在520世界陌生人节当天,移动社交平台陌陌通过对近万名网友进行调查,发布了《2020陌生人社交行为报告》。报告显示,近九成网友愿意和陌生人做...
日期:07-14
SpaceX实现盈利:一条漫长的“弑神”之路_spacex怎么盈利
本文作者:何伊然,编辑:刘宇翔,原文标题:《SpaceX的“弑神”之路》,题图来自:视觉中国SpaceX赚钱了!据媒体报道,SpaceX内部人士透露的财务数据显示,2023年第一季度SpaceX的营业收入为15...
日期:08-25