您的位置:首页 > 互联网

新型稀疏LVLM架构MoE-LLaVA 解决模型稀疏性相关的性能下降问题_稀疏表示模型

发布时间:2024-01-31 16:00:06  来源:互联网     背景:

要点:

1、MoE-LLaVA是一种新型稀疏LVLM架构,使用路由算法仅激活top-k专家。

2、MoE-LLaVA在各种视觉理解数据集上表现相当甚至超越了LLaVA-1.5-7B。

3、MoE-LLaVA采用三阶段的训练策略,以降低稀疏模型学习的难度。

1月31日 消息:MoE-LLaVA是一种新型稀疏LVLM架构,通过使用路由算法仅激活top-k专家,解决了通常与多模态学习和模型稀疏性相关的性能下降问题。研究者联合提出了一种新颖的LVLM训练策略,名为MoE-Tuning,以解决大型视觉语言模型(LVLM)的扩大参数规模会增加训练和推理成本的问题。

项目地址:https://github.com/PKU-YuanGroup/MoE-LLaVA

Demo地址:https://huggingface.co/spaces/LanguageBind/MoE-LLaVA

ipad在哪个平台出售

此外,MoE-LLaVA在各种视觉理解数据集上表现相当甚至超越了LLaVA-1.5-7B。该架构采用三阶段的训练策略,以降低稀疏模型学习的难度,从而建立稀疏LVLMs的基准,为未来研究开发更高效和有效的多模态学习系统提供宝贵的见解。

论文提出了MoE-LLaVA的三阶段训练策略。第一阶段的目标是让视觉token适应到LLM,使LLM具备理解图片实体的能力。第二阶段的目标是用多模态的指令数据来微调,以提高大模型的能力和可控性。

宿华占快手股份多少

第三阶段使用第二阶段的权重作为初始化以降低稀疏模型学习的难度。在模型构建中,MoE-LLaVA是第一个基于LVLM搭载soft router的稀疏模型。研究团队在5个图片问答benchmark上验证了MoE-LLaVA的性能,并报告了激活的参数量和图片分辨率。

为了验证MoE-LLaVA的多模态理解能力,研究在4个benchmark toolkit上评估了模型性能。结果显示,MoE-LLaVA可以用更少的激活参数达到和稠密模型相当甚至超过的性能。研究还采用POPE评估pipeline验证MoE-LLaVA的物体幻觉,结果表明MoE-LLaVA展现出最佳的性能,以较少的激活参数超过了LLaVA。

MoE-LLaVA能够帮助我们更好地理解稀疏模型在多模态学习上的行为,为未来研究和开发提供了有价值的见解。

荣耀magic2主摄

稀疏优化模型的应用


返回网站首页

本文评论
迅雷:第二季度营收7830万美元 同比增长41.9%_云业务带来新价值 迅雷连续七季度营收增长
奔驰gla奥迪q3宝马x1对比飞利浦手机好吗 查看最新行情   讯8月16日晚间消息,今日,迅雷公布了截至2022年6月30日第二季度未经审计的财报。据财报显示,迅雷...
日期:08-18
构建中国云生态|华云数据携手和信创天完成产品兼容互认证 推出基于超融合架构的混合云桌面联合解决方案
  日前,华云数据推出的国产通用型云操作系统安超OS 2020与和信创天的“和信下一代云桌面系统VENGD”完成产品兼容性互认证。并在此基础上,双方展开进一步合作,联合打造“基...
日期:07-23
2023年诺贝尔物理学奖公布:又一位女性获奖_2022年诺贝尔物理学奖
今年的诺贝尔奖,女性科学家爆发了。昨天的医学和生理学奖有一位女性,今天的物理学奖又有一位女性。10月3日,在瑞典首都斯德哥尔摩,瑞典皇家科学院宣布,将2023年诺贝尔物理学奖授...
日期:10-03
千亿联接全面加速,共同将5.5G带入现实-华为甘斌,万兆产业全面成熟
4月20日消息今日,在2023年华为全球分析师大会上,华为无线网络产品线副总裁、首席营销官甘斌就“将5.5G带入现实” 进行主题发言。甘斌表示,随着5.5G产业链加速成熟、商业场景逐...
日期:10-02
好未来Q1营收2.24亿美元,同比下滑83.8%,净亏损同比收窄(好未来2018年营收)
iPhone的黑科技手机以旧换新买Uber无人驾驶生鲜电商发展困境 查看最新行情   讯 北京时间7月29日下午消息,好未来(NYSE:TAL)今日公布了截至2022年5月31日的...
日期:07-31
苹果5k烧屏「苹果承认iPhone15存在烧屏问题 iOS17.1已修复这些问题」
10月18日 消息:苹果的最新iPhone15系列发布后,不少用户遭遇了烧屏问题。这对于苹果的老用户来说,并不陌生,因为类似问题在自iPhone X以来的每一代新iPhone(使用OLED屏)发布后都曾...
日期:10-19
斯坦福模型介绍「维基百科+大模型打败幻觉!斯坦福WikiChat性能领先GPT-4」
要点:1. 维基百科+大模型打败幻觉,斯坦福WikiChat在事实准确性和其他指标上表现优秀。2. 斯坦福研究人员利用维基百科数据训练大模型WikiChat,成功减轻了幻觉问题,并在事实准确...
日期:01-04
微软收购了「微软收购暴雪新进展:FTC 已撤回内部审理工作」
IT之家 7 月 21 日消息,根据彭博社报道,美国联邦贸易委员会(FTC)已经暂停了内部审理工作,意味着该机构有望和微软和解,通过谈判方式磋商收购动视暴雪事宜。这项新进展对于微软来说...
日期:07-21
特斯拉4680电池将于2023年第一季度在柏林超级工厂生产_特斯拉4680电池投产
IT之家 9 月 14 日消息,2020 年 9 月 23 日,特斯拉在电池日活动上正式发布了 4680 电池,并计划在今年正式投产。特斯拉表示,4680 电池的单体能量提高了 5 倍,整车续航里程可增加...
日期:09-20
李彦宏宣布启动"文心杯"创业大赛 参赛者最高可获千万大奖
5月31日,百度创始人、董事长兼首席执行官李彦宏在摩根大通全球中国峰会期间宣布,百度将设立10亿元人民币的百度文心投资基金,旨在推动大模型生态繁荣,同时启动"文心杯"创业大赛,...
日期:05-31
视源股份(CVTE)2019届春季校园招聘正式启动(视源招聘官网)
  近日,视源股份(CVTE)2019届春季校园招聘正式启动。在2018年的校园招聘中,视源股份(CVTE)踏足了广州、长沙、厦门、武汉、杭州等全国21座城市,得到众多毕业季高校学生的关...
日期:04-18
她教人坐高铁火了,钱和烦恼都来了 拒绝很多电视采访_教学坐高铁
近日,一名自称“打工仔小张”的女性在抖音上走红成为了网红。这源于她在一月底发布的四分钟以下的视频《小张手把手教你第一次去高铁站如何坐高铁》。在视频中,她用普通的晃动...
日期:04-04
CFTC靠罚款今年就“赚”了13亿美元
《CFTC靠罚款今年就“赚”了13亿美元》文章已经归档,不再展示相关内容,下文是的自动化写作机器人,通过算法提取的文章重点内容。这只AI还很年轻,欢迎联系我们帮它成长:美国商品期...
日期:08-01
史上最强手机SoC!A17 PRO处理器背后揭秘:苹果果然留了一手「a17处理器是多少」
快科技9月13日消息,伴随着iPhone 15 Pro的发布,苹果A系列全新处理器正式与大家见面。这一次命名很有意思,不叫A17 Bionic,而是叫A17 PRO。这也是苹果首次以PRO来命名处手机芯片,...
日期:09-14
欧科云链徐明星链上安全产业版图雏形渐显_徐明星-欧科云链
  导语:   1A1zP1eP5QGefi2DMPTfTL5SLmv7DivfNa   你眼前的这个数字和字母组合非但不是一串乱码,还很值钱,它是比特币创造者中本聪的地址之一。比特币地址如同银行卡账...
日期:05-21
当之无愧的明星店长!苏宁员工“组合拳式”营销方法走红
  近日,苏宁红孩子济宁店一员工想出“组合拳式”营销方法走红网络,鉴于疫情期间的特殊情况,通过直播、社群、小程序、推客等多种营销方式带动门店业绩,服务母婴群体,不仅超额...
日期:12-28
TechInsights:2023年Q3全球智能手机市场持稳,三星位居榜首
通信世界网消息(CWW)TechInsights发布的最新报告显示,三星在全球智能手机市场份额为20%,位居榜首。苹果以约16%的市场份额位居第二。小米,OPPO(包括一加)和传音跻身前五,其次是viv...
日期:11-04
苏大维格光刻机实现突破 ?业内回应“此光刻非彼光刻”!「苏州苏大维格光电科技股份有限公司」
光刻机实现突破?今日,苏大维格(300331.SZ)一则自称“已实现光刻机销售”的互动平台回复引爆市场,公司股价午后短时间内蹿升至涨停。不过,多位业内受访人士均表示,此光刻非彼光刻...
日期:09-15
SpreadJS与Vue集成,苏宁集团『极客办公』系统开发案例
  “造极”如今已成为苏宁集团的年度核心关键词。“造极”在具体工作上的体现,代表着苏宁不断追求极致的工匠精神,即对待每一个环节,都要严格要求、精益求精。“极客办公”...
日期:10-24
uu跑腿是什么企业「UU跑腿企业版:利用AI技术拓展应用渠道,助力企业实现商业突破」
近年来,人工智能(AI)技术在全球市场得到广泛应用,深入到各行各业,为企业带来了巨大的发展机遇。从汽车行业的智能驾驶到医疗健康的疾病预测,再到制造业的生产流程优化,AI正逐渐改变...
日期:11-02