您的位置:首页 > 互联网

挑战GPT-4V!清华唐杰&智谱开源多模态14边形战士CogVLM-17B,在线可玩

发布时间:2023-10-10 20:28:43  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:梦晨,授权转载发布。

看看这张图中有几个房子?如果你回答3个,就和GPT-4V的答案一样。

但是最新开源的国产多模态模型CogVLM-17B,就能看出另有玄机。

甚至能区分在图中完整可见的有3个和部分可见的有1个。

CogVLM由清华和智谱AI合作开发,通讯作者为唐杰和丁铭,论文和开源代码已上传到GitHub。

闲鱼上华为mate40rs保时捷

除这个单独案例之外,CogVLM-17B还在10项权威跨模态基准上取得了SOTA性能。

另外在VQAv2, OKVQA, TextVQA, COCO captioning取得第二,超越或匹配谷歌的PaLI-X55B。

与之前的开源多模态大模型相比,可以算是14边形战士。

三维扫描仪品牌

雷达图中包含13个基准,最后一个TDIUC单独展现。

CogVLM可以回答各种类型的视觉问题,比如从马斯克的阴阳怪气中推理出小扎假装去旅行了,回避约架。

认出照片中的C罗,并回答他在2018年世界杯中有多少进球。

带图的编程题也能给出代码了。

甚至能完成复杂的目标检测,并打上标签,自动数据标注成了。

从浅层对齐到深度融合

CogVLM模型包含4个基本组件

  • ViT编码器

  • MLP适配器

  • 大型预训练语言模型

  • 视觉专家模块

其中,每层中都添加了可训练的视觉专家模块,以实现图像特征和文本特征的深度对齐,而不会牺牲任何NLP任务的性能。

之前主流的浅层对齐方法,如BLIP-2,图像特征和语言模型之间缺乏深度融合,导致性能不佳。

但微调语言模型的全部参数又会损害其NLP能力。

CogVLM的方法可以说是改变了视觉语言模型的训练范式,从浅层对齐转向深度融合。

另外值得注意的是,CogVLM训练数据中没有专门的OCR数据,但表现出了很强的文字识别能力。

CogVLM开源并给出了在线试玩。

不过目前仅支持英文,后续会提供中英双语版本支持,可以持续关注。

试玩地址:

https://36.103.203.44:7861

开源及论文地址:

https://github.com/THUDM/CogVLM

—完—

一加7pro什么时候上市

魅族mx4刷ubuntu


返回网站首页

本文评论
Linux之父终于被劝动:用了30年的Linux内核C语言将升级至C11
  还在使用89年版C语言的Linux内核,现在终于要做出改变了。   今天,Linux开源社区宣布,未来会把内核C语言版本升级到C11,预计5.18版之后生效,也就是今年5月。   这个决定...
日期:07-17
ibm退出面部识别业务_IBM 宣布退出人脸识别业务
  北京时间 6 月 9 日消息,IBM 公司 CEO 阿尔文德 · 克里什纳 (Arvind Krishna)周一呼吁美国国会实施改革,以推进种族平等,抗击系统性种族主义。他同时宣布,IBM 将退出人脸...
日期:07-14
国庆前三日总票房达 19.1 亿,《长津湖》4 天票房 15 亿_《长津湖》票房突破42.5亿
  10 月 3 日消息 根据灯塔专业版消息,2021 年国庆假期前三天,我国电影总票房达到了 19.1 亿元,前三天单日票房分别为 6.29 亿、6.33 亿、6.46 亿。档期票房前三的电影分别...
日期:07-17
携程租车是营运车吗「携程租车和腾讯出行服务正式达成合作」
9 月 28 日消息,近日,携程租车和腾讯出行服务正式达成合作,携程租车正式入驻腾讯出行服务,为腾讯出行服务的用户提供一站式在线预订国内租车服务。自 9 月 20 日起,用户通过“微...
日期:10-01
iPhone二手格外火 保值又好用「二手苹果避坑」
相关数据显示,iPhone目前在二手市场以旧换新的价格超过了200美元,二手市场上最受欢迎的苹果手机是:iPhone 11,iPhone XR,iPhone 12,iPhone 11 Pro Max和iPhone 12 Pro Max。instag...
日期:05-31
来了!网友晒图日本正式开始向太平洋排放核废水 放射性不敢想「日本向太平洋投放核废水」
有网友发帖称,日本正式开始向太平洋排放核废水,同时还附上了相应的图。这很意外吗?其实不会,东京电力公司已经发布消息称,福岛第一核电站核污染水排海工程陆地上排放设施将于本周...
日期:06-11
全球网络攻击问题「黑客攻击欧盟议会网站长达数小时 导致网络瘫痪」
凤凰网科技讯 北京时间11月24日消息,外媒称,欧洲议会研究所所长表示,欧洲议会网站(European Parliament's website)在当地时间周三遭到“亲克里姆林宫”黑客的拒绝服务攻击,导致网...
日期:11-26
骁龙8 Gen3将10月发布 小米14或首发_骁龙8cx gen4
高通骁龙8 Gen3芯片的发布时间已提前至10月底。与此同时,搭载该芯片的旗舰手机也将陆续推出。首批搭载高通骁龙8 Gen3芯片的手机包括小米14系列、vivo X100系列、iQOO 12系列...
日期:06-02
科技创新催生娱乐内容新形态   国内首个互动影视作品《他的微笑》6月20日上线爱奇艺
  6月20日,国内首个全新带入式互动影视作品《他的微笑》正式全集上线爱奇艺App,引领中国娱乐行业开启互动影视内容新时代。在5月初的2019爱奇艺世界·大会上,爱奇艺全球首次...
日期:08-02
通过Wi-Fi名称跨城60公里找回手机 女主:不追究对方责任、给华为点赞
近日,广州一女子手机丢失后,进入手机查找设备”APP,依手机定位确定小区楼栋。随后,该女子又通过手机所连接的Wi-Fi账号逐层逐户排查,最终锁定住户,在警方的协助下顺利拿回手机。针...
日期:10-06
配备零重力按摩座椅及车载冰箱-魏牌高山内饰首次曝光_魏山巍 高瓴
【】7月19日消息,今日魏牌正式对外公布了旗下首款MPV车型魏牌高山的内饰图,该车预计将于8月正式上市,售价会在30-40万元级别,上市之后将会与腾势D9形成直接竞争关系。魏牌高山采...
日期:09-20
吐鲁番发型「吐鲁番多名游客突然头发直立如刺猬 官方科普:有遭雷击风险」
8月15日消息,今日,一段新疆吐鲁番多名游客头发突然直立如刺猬的视频引起网友热议。风管机和空调哪个家用好有网友看后表示:应该马上坐进车里关上门。车体相当于一个法拉第笼,是...
日期:08-16
今日头条旗下中融小贷申请发行300亿ABS 已被受理(小额贷款ABS)
(原标题:今日头条旗下中融小贷申请发行300亿ABS 已被受理) 雷军电动汽车是小米吗近日,抖音集团旗下深圳市中融小额贷款有限公司(...
日期:08-20
90后男子熬夜斑秃后随身带姜擦头 当事人姐姐:既惊讶又心疼_斑秃的地方用生姜擦头皮能长发吗
3月30日消息,河南郑州一90后男子因压力太大,白天上班晚上熬夜做代驾,长期熬夜后导致其头上出现三块斑秃。这天男子去看望快要生产的妻子时,随手掏出一块生姜,一直在斑秃的地方涂...
日期:03-30
苹果计划拆建库比蒂诺园区一幢办公大楼 占地面积扩大1倍以上
4月8日消息,苹果公司计划下周召开公开听证会,计划拆建库比蒂诺(Cupertino)园区内的一幢办公大楼。该拆建计划已经通过该市规划委员会的允许,本次听证会主要听取周围居民的意见。...
日期:10-03
新款iPhone 14只要4999 iPhone 13也只仅4388_iphone 12 5399
3年来,今年的双十一促销活动是最大的,无论是产品力还是整体的价格让价,今年的双11都适合囤货,尤其是苹果旗下的设备,现在降幅最高的是iPhone13、iPhone14两款新机。iPhone 14和iP...
日期:11-09
小米redmik40增强版_小米MIUI本周修复公告:Redmi K40稳定性即将更进一步
  自从小米MIUI 12系统饱受吐槽开始,官方就成立了专项修复组,专门针对每周反馈的问题进行修复和解答,小米负责人每周都会与用户能直接对话。   8月27日,MIUI官方公布了本周...
日期:07-17
2020年比亚迪云巴的最新消息「治堵神器!比亚迪李慧:云巴将会是下一个新能源汽车」
快科技4月29日消息,4月27至29日,北京-青岛国际城市轨道交通展览会暨高峰论坛(MetroTrans)暨首届中国城市轨道交通高新技术成果交易会(高交会)在青岛市中铁青岛世界博览城启幕。在...
日期:04-30
魔百盒怎样下载应用_魔百盒怎么下载软件?魔百盒最新安装教程分享
  魔百盒作为网络机顶盒里的优质品牌,深受广大用户的喜欢。但是在最近有不少用户反馈魔百盒在刷完机后,软件无故被清空,再次安装仍然会被删除。不少网友猜测是因为魔百盒...
日期:01-23
ai也不一定就能提高工作效率 有时还可能拖后腿「OpenAI CEO:AI可以提高员工生产力 但也会制造更多失业」
7月28日 消息:OpenAI的首席执行官Sam Altman说,生成型人工智能(AI)技术,如ChatGPT,可能会在未来几年提高许多员工的生产力,但也有可能导致一些人失去工作。事实上,福特汽车在电动...
日期:07-29