您的位置:首页 > 互联网

魔搭社区开源多模态对齐统一框架OneLLM_魔搭科技公司

发布时间:2023-12-22 10:46:46  来源:互联网     背景:

12月22日 消息:OneLLM 是一种多模态对齐的统一框架,它使用通用编码器和统一的投影模块与 LLM(Large Language Model)对齐多模态输入。OneLLM 还通过使用 modality tokens 实现了在不同模态之间的切换。

OneLLM 的核心组件包括多模态 token 的 tokenizer、通用编码器、统一的投影模块和大语言模型。

多模态 token 的 tokenizer 将输入的各种模态信号转换为 token 序列,以便进行后续处理和对齐。

通用编码器是在 LAION(Language and AI ON)平台上训练的 CLIP VIT Large 模型,它具有强大的语义理解能力,可以对多模态输入进行编码。

统一的投影模块(UPM)是将各个模态的输入投影到 LLM 的 embedding 向量空间中,以实现多模态的对齐。UPM 由 K 个投影专家组成,每个专家包含多个 transformers 块和大量的参数。

魔搭科技

大语言模型是 OneLLM 采用的开源 LLaMA2-7B 模型,它在大规模文本数据上进行了预训练,可以对输入进行更深入的语义理解和生成。

OneLLM 支持多种不同模态数据的理解,包括图像、音频、视频、点云、深度 / 法线图、IMU 和 fMRI 大脑活动。

实验证明,OneLLM 在视频 - 文本、音频 - 视频 - 文本、音频 - 文本等任务中优于现有方法,表现出了较强的零样本能力。

Github代码链接:

https://github.com/csuhan/OneLLM

模型权重链接:

a75主板支持什么显卡

魔搭科技公司

拆解airpods pro

https://modelscope.cn/models/csuhan/OneLLM-7B

模型创空间:

https://modelscope.cn/studios/csuhan/OneLLM

纯电迈凯轮


返回网站首页

本文评论
科技部部长十天两提ChatGPT 人工智能相关企业超257.7万家
凤凰网科技讯 3月6日消息,据天眼查数据显示,截至目前,我国现有人工智能相关企业超257.7万家,十天内,科技部部长王志刚在不同的场合两次提到了智能聊天工具ChatGPT。董明珠改革格...
日期:03-06
卖毛蛋一天能挣多少钱「男子赶集买毛蛋到家全变鸭子 网友:长得够快」
湖南邵阳,因女儿想吃毛蛋,一爸爸去集市购买了33个毛蛋。然而,当他们回到家后发现,这些毛蛋里已经孵出了小鸭子。当事人贺女士表示,她们将会饲养这些小鸭子。为什么美国iphone便宜...
日期:06-15
成功拿下漫威IP 鹿客让“钢铁侠”实现回归
  前段时间,《复联4》强势席卷全球院线,火爆程度再次证明了漫威的巨大影响力。当观众还为再难一睹钢铁侠的风采唏嘘不已时,国内一家智能门锁企业就用一种堪称硬核的方式,让钢...
日期:10-02
拜登电动车目标太急于求成!汽车巨头:或导致灾难性后果_拜登发展电动车
财联社7月11日(编辑 黄君芝)全球最大的两家汽车制造商近日表示,美国总统拜登加紧拥抱电动汽车的计划,可能会让美国的充电基础设施不堪重负,并造成灾难性的供应短缺。丰田(Toyota)和...
日期:07-11
CIVC 2023第一届中国工业视觉大会正式确定!
  近年来,人工智能技术不断取得突破,在产业化、商业化项目中得到广泛应用,作为最早在工业领域落地的人工智能技术之一,机器视觉通过引导、识别、测量、检测等智能化功能为现代...
日期:06-07
真我“不讲武德”,1699元的起售价,真我10 Pro+力压千元机市场
今年的手机市场有点意思,可能是受经济环境影响,以前大家聚焦的中端机、旗舰机销量有所下滑,很多用户都因为价格望而却步,反倒是千元机市场,内卷非常严重。本以为荣耀X40的曲屏,已...
日期:11-25
美团公司股权「美团入股大模型公司智谱AI」
7月19日 消息:天眼查App显示,近日,中文认知大模型平台智谱AI关联公司北京智谱华章科技有限公司发生工商变更,股东新增美团旗下天津三快科技有限公司,注册资本由约1480.69万人民...
日期:07-19
苹果m3处理器是什么级别「背刺Intel!苹果连发三款3nm处理器:M3系列性能暴增、表现让高通紧张」
快科技10月31日消息,或许是为了迎合中国用户,又或者别的原因,反正苹果把这场新Mac的发布会挪到了北京时间早上8点,新一代大众凌渡发布会一开始,苹果就扔出了王炸,三款M3处理器,分别...
日期:10-31
天玑920评测「调校最好的天玑9200 手机!Redmi K60至尊版本月登场」
快科技8月3日消息,小米集团卢伟冰宣布,Redmi K60至尊版将在本月发布。卢伟冰介绍,Redmi K60至尊版搭载天玑9200 芯片,这次联发科给了很大的权限,双方深入底层开始调校,是双方有史...
日期:08-03
戴尔 惠普_戴尔/惠普称不会在Win8品牌机中封杀Linux
  自从微软宣布在Windows 8中采用UEFI统一可扩展固件接口进行安全启动(Secure Boot)之后,Linux供应商们就忧心忡忡,担心Windows 8品牌机会屏蔽Linux。尽管微软一再表示,Wind...
日期:07-24
魔兽等游戏停服一个月 暴雪真不着急:两家中国公司抢破头_魔兽停更两年
对魔兽玩家来说,今天是国服停服一个月的日子了,但是暴雪跟网易分手之后,国内新代理花落谁家一直没有明确消息,现在有爆料称暴雪反而不着急了,因为有两家国内游戏公司正在抢着开价...
日期:02-25
医学中gpt「GPT-4在医学问题上击败了专业调优的 MedPaLM 2 模型」
12月4日 消息:在研究中,微软的研究人员展示了GPT-4在医学知识测试中的卓越表现,特别是当结合先进的提示工程技术时,其性能超过了专业调整的MedPaLM2。研究结果显示,相较于费时费...
日期:12-04
苹果7s「苹果7s plus屏幕多大」
随着科技的不断发展,苹果公司又推出了新一代的智能手机——。这款手机不仅在外观上做了一些微小的调整,还在性能和功能上进行了升级,下面就让我们来了解一下它的详细信息。外观...
日期:05-30
去哪儿2023春节报告:国内酒店预订间夜量达历史新高
1月31日 消息:去哪儿近日发布2023年春节报告,数据显示,春节期间平台上每位出行者比去年多走了400公里,而出境机票同比2022年增长达6.7倍。截止1月26日,热门城市机票预订量已超过...
日期:01-31
robots生成「DataRobot宣布推出新的应用生成式AI产品」
8月11日 消息:人工智能初创公司DataRobot Inc.今天宣布了一项新的生成式AI产品,旨在让企业和开发者将他们的数据集成到AI模型中,并对他们得到的答案有信心。特斯拉国产model 3...
日期:08-11
苹果2020财年印度业务净利润激增253% 达1.25亿美元(印度2020经济增长)
11月10日消息,据国外媒体报道,商业信息平台Tofler获悉的数据显示,2020财年,科技巨头苹果在印度的收入增长了约29%,达到1375.58亿卢比(约18.58亿美元),净利润达到了92.62亿卢比,同比增...
日期:08-01
华为拿下今年第二大 5G 大单_华为获首个5G
  10 月 4 日消息 中国移动上周发布了的招标公告,其中备受关注的 75 亿大单“中国移动 2021 年 4G/5G 融合核心网采购招标”结束,华为拿下第一份额,这意味着华为夺得今年第...
日期:12-16
iphone se4寸「iPhone SE4配置曝光 用上OLED售价3000」
中关村在线消息:今日,分析师郭明錤曝光了苹果新机iPhone SE4的相关消息,据悉新机将首次用上全面屏,首次用上OLED屏幕。不过苹果可能延后iPhone SE4的发布时间,改为全面屏也将增加...
日期:12-21
京东618:首购新用户同比增长超30% 特斯拉充电装备双TOP1
6月2日 消息:5月31日晚8时,京东618全面开启,截止6月1日24时,京东618带动首购新用户同比增长超30%。开门红4小时,iPhone、小米、荣耀、华为、一加、iQOO、三星手机成交额同比增长...
日期:06-02
iPhone14Pro双11优惠!幅度超过500「iPhone12pro优惠」
中关村在线消息:10月28日,据相关爆料,苹果今年的双11优惠政策已经公布,28号0点后可以在天猫双十一的苹果会场领到惊喜券,这次双11活动优惠最大的产品是iPhone13系列,最高优惠700元...
日期:11-03