您的位置:首页 > 互联网

零一万物Yi-VL多模态语言模型上线 包括Yi-VL-34B、Yi-VL-6B两个版本

发布时间:2024-01-23 14:24:43  来源:互联网     背景:

1月23日 消息:零一万物 Yi-VL 多模态语言模型是零一万物 Yi 系列模型家族的新成员,它在图文理解和对话生成方面具备卓越的能力。Yi-VL 模型在英文数据集 MMMU 和中文数据集 CMMMU 上都取得了领先成绩,展示了在复杂跨学科任务上的实力。Yi-VL 模型分为 Yi-VL-34B 和 Yi-VL-6B 两个版本,它们在全新多模态基准测试 MMMU 中表现出色。MMMU 数据集包含了来自六大核心学科的11500个问题,涉及多种异构图像类型和交织的文本图像信息。Yi-VL-34B 在该测试集上以41.6% 的准确率超越了一系列多模态大模型,仅次于 GPT-4V,展现了强大的跨学科知识理解和应用能力。在针对中文场景打造的 CMMMU 数据集上,Yi-VL 模型也展现了独特优势。CMMMU 包含约12000道源自大学考试、测验和教科书的中文多模态问题。Yi-VL-34B 以36.5% 的准确率紧随 GPT-4V 之后,领先于当前最前沿的开源多模态模型。Yi-VL 模型的核心亮点之一是基于 Yi 语言模型的强大文本理解能力,它只需对图片进行对齐,就可以得到优秀的多模态视觉语言模型。Yi-VL 模型基于开源 LLaVA 架构,包含三个主要模块:Vision Transformer(ViT)、Projection 模块和大规模语言模型 Yi-34B-Chat 和 Yi-6B-Chat。ViT 用于图像编码,Projection 模块实现了图像特征与文本特征空间对齐的能力,大规模语言模型提供了强大的语言理解和生成能力。Yi-VL 模型的训练过程分为三个阶段:第一阶段使用1亿张的 “图像 - 文本” 配对数据集训练 ViT 和 Projection 模块;第二阶段将 ViT 的图像分辨率提升至448x448,并使用约2500万 “图像 - 文本” 对进行训练;第三阶段对整个模型的参数进行训练,目标是提高模型在多模态聊天互动中的表现。除了 Yi-VL 模型,零一万物技术团队还验证了使用其他多模态训练方法(如 BLIP、Flamingo、EVA)基于 Yi 语言模型可以快速训练出能够进行高效图像理解和流畅图文对话的多模态图文模型。Yi-VL 模型地址:https://huggingface.co/01-aihttps://www.modelscope.cn/organization/01ai

华为官宣折叠屏手机

抖音萌知计划

医疗数据治理与数据挖掘服务

腾讯股票回购


返回网站首页

本文评论
蔚来总裁秦力洪:发V2G充电桩 推电池日租 我们比加油方便「蔚来20kw充电桩代工」
【网易科技7月20日报道】NIO Power Day 2023,蔚来发布20kW V2G充电桩,推出电池灵活升级日租服务,宣布“丝绸之路”打通,年底实现一路换电,穿越欧洲五国。记者获悉,全新的20kW V2G...
日期:07-20
50万粉以上大V需实名,短视频行业又“地震”了
声明:本文来自于微信公众号卡思数据(ID:caasdata6),作者:叫我娜姐,授权转载发布。短视频行业又迎来一项重磅新规。10月13日,微博财经大V透露风声,“全网自媒体要实施前台实名制,即...
日期:11-09
续航再次登顶!iPhone14系列将配备史上最大电池,安卓手机很羡慕「iphone13电池容量排行」
随着智能手机的不断更新换代,手机上的各种配置都得到了升级,无论是屏幕、处理器、马达、拍照、系统等都得到了升级,随着手机功能的不断完善,随之而来的续航问题也随之而来,为了解...
日期:09-27
蚂蚁接亲婚车租赁_接亲网创立五年:靠谱的婚车租赁品牌成长记
  现在不管是农村还是城市的人们结婚,接亲都会有很豪华的婚庆车队。中国人多半好面子,喜欢在结婚的时候撑场面,丈母娘们也希望自己的女儿能风风光光地出嫁。而由于线下市场...
日期:08-23
LinkedIn正测试用微软的AI艺术生成器来设计帖子
本文要点:1. LinkedIn 正在测试将Microsoft Designer 整合到其平台上,使用户能够在 LinkedIn 上创建独特的视觉内容。2. Microsoft Designer 是微软推出的一个与 Canva 竞争...
日期:08-04
截至8月末,我国5G基站总数达313.8万个_我国5g基站数已经超过60万个
通信世界网消息(CWW)9月21日,工业和信息化部运行监测协调局公布了2023年1—8月份通信业经济运行情况,截至8月末,我国5G基站总数达313.8万个,占移动基站总数的27.5%。值得注意的是,...
日期:09-23
苹果公司将于10月27日公布2022财年第四财季财报「苹果二季度财报」
9月29日消息,据国外媒体报道,当地时间周三,苹果公司宣布,将于10月27日公布2022财年第四财季财报。2022财年第四财季,苹果发布了iPhone 14系列手机、Apple Watch Series 8、第二代...
日期:09-30
苹果3c产品是什么「“618”大促里的3C数码:出货量下行 苹果下场直播带货」
①受智能手机出货量下行压力,手机厂商早早就开启了618年中大促。②苹果官方下场,在天猫官旗开启全球直播首秀。③年中大促线下气氛淡,但有“隐藏福利”财联社|新消费日报5月31...
日期:06-01
等了2年的修正终于来了 Win11 25915版发布:任务栏不再强制合并「win11任务栏不合并」
快科技7月28日消息,微软的Win11发布2年半了,强制任务栏合并的设定也让大家吐槽了两年,好在今年微软终于被大家喷到肯改了,现在Win11 25915版实装了不再强制合并的功能。微软今天...
日期:07-29
-硅谷热辩 AI是否会毁灭人类?
5月22日消息,随着生成式人工智能等新技术成为科技界新热潮,关于人工智能是否会毁灭人类的争论愈演愈烈。有知名科技领袖警告称,人工智能可能会接管整个世界。其他研究人员和高...
日期:09-27
印度人口是第一吗「专家:印度人口将是中国三倍 成全球第一人口大国」
快科技5月27日消息,人口经济学家、携程董事长梁建章在《人口战略》新书发布会上表示,中国的总人口小于印度是标志,但也是预料之中的。杨振宁是最伟大的物理学家据联合国数据显...
日期:05-27
oppo手机a1参数「1999元!OPPO A1手机开启预售:120Hz高刷高亮屏 12GB大运存」
OPPO A1 5G手机已经开始同步在线上线下预售,售价为1999元。这款手机拥有多种特点,包括素皮材质、5000mAh大电池和67W超级闪充等功能。网络创业培训电商vivox90标准版是什么芯...
日期:04-11
抖音“丽水宝藏古村”等项目入选最佳“全球减贫案例”「丽江宝藏古村」
11月18日消息,2022全球减贫伙伴研讨会近日在北京召开,为世界减贫事业贡献中国智慧和中国方案。本次研讨会由中国国际扶贫中心、国际农业发展基金、联合国粮食及农业组织等联合...
日期:11-19
紫光展锐荣登通信世界“2023年度5G实力榜——5G十大领航企业”
通信世界网消息(CWW)6月4-6日,第31届中国国际信息通信展览会(PT展)在北京隆重召开。由通信世界全媒体举办的“2023年度5G实力榜”评选结果正式揭榜,紫光展锐凭借在5G领域深厚的创...
日期:06-08
7499元!红魔8S Pro 手机24GB 1TB氘锋透明版上架_红魔氘锋透明版测评
努比亚红魔 8S Pro 暗夜骑士、冰封银翼、氘锋透明、一诺签名版和大黄蜂五款配色发布。这款手机采用蚀刻工艺,后置 RGB 跑马灯支持自定义灯效。领克01油电混合suv价格配置方面...
日期:09-27
IDC报告:到2027年,生成式AI将取代 30% 的营销任务
划重点:- 高压线跳闸收费标准小米市值破千亿美元MacBook Pro Max大学生购票优惠政策...
日期:01-09
高德正式上线Apple产品订购服务 「回家顺路取个“苹果”」_高德地图苹果授权店是真的吗
【】8月31日消息,据高德地图官微消息,高德地图与全国4000多家Apple授权经销商达成合作,推出Apple产品“随手买、顺路取”服务。华为无线充电最高多少w即日起,用户通过高德地图搜...
日期:09-16
荣耀30升级鸿蒙怎么样「三年前老机型也能升!荣耀30系列推送鸿蒙4」
根据厂商是关同学的最新爆料,荣耀30系列手机已经推送了鸿蒙4系统。这款新系统带来了全新的主题和功能,让老用户感到非常满意。据用户反映,升级后的荣耀30 Pro在全新主题的加持...
日期:10-16
一项研究认为古代火星可能充斥着生命_有研究指出,火星远古时期
根据一项模拟年轻火星条件的研究,在火星历史的早期,这颗红色星球很可能适合甲烷菌居住。根据亚利桑那大学的科学家领导的一项新的研究,如果火星上曾经有生命,那么在这个星球的幼...
日期:10-16
赛博朋克2077预购销量「《赛博朋克2077》更新销量数据:已卖出2000万份」
  9月28日晚间,游戏公司CD Projekt官微宣布,《赛博朋克2077》累计销量突破2000万份。据了解,CD Projekt花了8年时间开发《赛博朋克2077》,成本高达12亿兹罗提(约合人民币17.28...
日期:10-03