您的位置:首页 > 互联网

Meta 宣布开源多感官 AI 模型 ImageBind:整合文本、音频、视觉等六种类型数据

发布时间:2023-05-10 11:06:18  来源:互联网     背景:

5月10日消息:Meta 宣布推出一个新的开源 AI 模型,可以连接多种数据流,包括文本、音频、视觉数据、温度和动作读数。

截屏2023-05-10 08.51.39.png

图片来自 Meta

该模型目前仅是一个研究项目,没有立即的消费者或实际应用,但它指向了未来可以创建沉浸式、多感官体验的生成式 AI 系统,并表明了 Meta 在对手 OpenAI 和 Google 日益注重保密的时候仍在分享 AI 研究。

廉价的电动牙刷有什么坏处

pc电脑排行榜前十名

该研究的核心概念是将多种类型的数据链接到一个单一的多维度索引中(或者使用 AI 术语中的「嵌入空间」)。这个想法可能有点抽象,但正是这个概念支持了生成式 AI 的最近繁荣。

苹果蓝牙不能用怎么解决

例如,像 DALL-E、Stable Diffusion 和 Midjourney 之类的 AI 图像生成器在训练阶段都依赖于系统,这些系统在连接文本和图像时共同寻找视觉数据中的模式,并将这些信息与图像的描述相连。这是使这些系统能够生成遵循用户文本输入的图片的基础。许多生成视频或音频的 AI 工具也是如此。

Meta 表示,它的模型 ImageBind 是第一个将六种类型的数据组合到一个单一的嵌入空间中的模型。包括在模型中的六种类型的数据是:视觉(以图像和视频形式呈现);热量(红外图像);文本;音频;深度信息;以及最有趣的——由惯性测量单元(IMU)生成的运动读数。(IMU 可在手机和智能手表中找到,在那里它们用于执行各种任务,比如从横向到纵向切换手机,区分不同类型的体育活动等。)

这个想法是未来的 AI 系统将可以像当前的 AI 系统对文本输入一样交叉参考这些数据。例如,想象一下一个未来的虚拟现实设备,它不仅可以生成音频和视觉输入,还可以生成你在物理舞台上的环境和动作。你可以要求它模拟一次长途航海,它不仅会把你放在一艘船上,背景中有海浪的声音,还会让你感受到甲板的摇摆和海洋空气的凉爽微风。

Meta 在一篇博客文章中指出,未来的模型可以增加其他感官输入流,包括「触摸、语音、气味和大脑功能磁共振成像信号」。它还声称,这项研究「将机器带到了人类能够同时、全面、直接地从许多不同形式的信息中学习的能力更近了一步」。(当然,这取决于这些步骤的大小。)

当然,这一切都非常推测性的,目前应用这些研究的可能性将会更加有限。例如,去年,Meta 展示了一种由文本描述生成短且模糊的视频的 AI 模型。像 ImageBind 这样的工作展示了系统未来版本如何整合其他数据流,例如生成与视频输出匹配的音频。

对于业内观察者来说,这项研究也很有趣,因为 Meta 正在开源其基础模型——这是人工智能世界中越来越受到关注的做法。

反对开源的人——比如 OpenAI——表示这种做法对创作者是有害的,因为竞争对手可以复制他们的工作,而且这可能会有潜在的危险,使恶意行为者利用最先进的 AI 模型。支持者回应说,开源允许第三方审查系统的问题并改进其缺陷。他们注意到这甚至可能提供商业利益,因为它实质上允许公司招募第三方开发人员作为不付费的工作人员来改进他们的工作。

Meta 迄今一直坚定地站在开源阵营,虽然并非没有困难。(例如,它最新的语言模型 LLaMA 今年早些时候在网上泄漏。)在许多方面,它在人工智能领域缺乏商业成就(该公司没有与 Bing、Bard 或 ChatGPT 等聊天机器人竞争的实际产品)使其能够采用这种方法。对于现在,在 ImageBind 上,它继续这个策略。


返回网站首页

本文评论
讯飞智能学习机告诉你:鼓励和方法对孩子多重要
  俗话说:“五岁成习,六十亦然”,好的学习习惯一定要从小培养,对于孩子来说,处于这个年纪,好奇心本就重,也缺乏耐心和毅力,如果没有家长在一旁督促,单靠孩子自己很难养成一个好习...
日期:07-16
在抖音直播,我看了场让陈丹青向往40年的展览
  上世纪80年代初   身在纽约的画家陈丹青   看到了山西娄睿墓壁画的照片图像   他被这幅画仪仗图深深震撼   “当时我们美术界的人都非常震惊,   因为它填补...
日期:07-14
iPhone 14 Pro立减800元 到手价格仅需8099元「14pro首发价」
iPhone 14 Pro近期立减800元,到手价格仅需8099元,优惠力度比较大感兴趣的可以冲啦。让家里的扫地机器人扫地amd发布基于zen3架构新锐龙处理器iPhone 14 Pro系列搭载一块6.1英...
日期:02-25
手机卡可随意购买 实名制被指“名不副实”(购买未实名制手机卡犯法吗)
  备受业界关注的手机实名制于2010年9月1日开始执行,按照规定购买手机卡要提交个人实名信息。年终岁末,记者对手机卡市场进行探访,发现这条规定并没有得到严格执行,没有身份...
日期:07-25
ALPD激光+2450CVIA高亮+MT9679芯片,当贝X5智能投影的真香选择
4 月 14 日当贝投影举办了春季新品线上发布会,发布了最 新 2 款激光投影——当贝X5 和当贝D5X Pro,其中当贝X5直接将国产旗舰版激光投影仪带上了新高度!下面就来抢先了解一下,...
日期:04-14
28日傍晚谷歌搜索出现大范围无法访问_谷歌搜索总是显示无法访问
  据微博网友反馈晚上7点开始,谷歌在中国大陆大范围无法访问。目前,Google的Gmail还可正常访问,广告系统也显示正常,英文谷歌地图maps.google.com无法访问,中文谷歌地图ditu.g...
日期:07-25
今天正式进入“三九”!全年最冷时段来了:强冷空气带领大范围雨雪来袭
一九二九不出手,三九四九冰上走小寒节气刚过去不久,今天已经正式进入三九”,这意味着我国全年最冷的时间段来了。近日,中国天气网统计了近30年来全国数九”期间的平均气温,发现我...
日期:01-09
腾讯微视人体姿态迁移黑科技加持,用一张照片即可变身“舞林高手”
  再也不用羡慕视频中的舞蹈大神了!6月9日,腾讯微视APP上线“照片会跳舞”新玩法,用户只需上传一张正面照片,即可生成逼真而带感的跳舞视频,从《两只老虎》跳到《大风吹》,秒...
日期:10-21
特斯拉降价了电动车降价没「特斯拉降价丰田不装了!首款电动车bZ4X狂降3万:仅需16.98万起」
2月9日消息,广汽丰田官方宣布称,旗下首款电动车bZ4X厂家限时直降30000元,降价后,起售价仅16.98万元。去年10月份广汽丰田bZ4X正式上市,新车共推出5款配置车型,售价格区间为19.98-2...
日期:02-10
优信发2022年Q4财报:营收4.71亿元 同比下滑7.1%「优信上市」
4月11日消息,二手车在线经销商优信集团发布未经审计的2022年第四季度财务报告(以下简称财报)。财报显示,截至2022年12月31日,零售交易量较去年同期增长77%。优信表示,有信心2023年...
日期:04-11
索尼社长对PS5充满信心:出货量很有可能破6000万_索尼ps5最新消息
近日,索尼公司社长兼COO十时裕树在摩根士丹科技峰会上,表达了他对于PS5主机极大的信任。在峰会上,十时裕树称:我认为我们PS5的出货量很有可能突破6000万,众所周知,PS4的出货量已经...
日期:03-12
北京年底试点居家养老物联网  覆盖老人需求_居家养老全覆盖
北京大批空巢家庭如何获得悉心周到的养老服务?记者从科博会获悉,看似高深的物联网在居家养老方面大有用武之地,覆盖远程医疗、紧急呼叫、家庭安防、社区家政等内容的社区居家...
日期:07-28
小米新能源汽车什么时候上市时间「年轻人的第一辆电动汽车!小米汽车计划2024年上半年量产」
3月24日消息,小米在财报中提到,小米汽车目标是2024年上半年量产,这意味着年轻人的第一辆电动汽车将会在明年跟消费者见面。官方介绍,2022年,小米在智能电动汽车等创新业务费用投...
日期:03-25
Shopee与极客时间联合打造一专多能型人才(shopee极速入驻)
  在互联网职业教育1.0和2.0时代,人才培养侧重于某一专业领域的知识或技能的学习。而到了3.0时代,T型人才成为培养主流。“T”中的“—”表示广博的知识面,“|”表示专业的...
日期:07-16
推特是美国哪家公司的「推特并入X公司 网友:这是要打造美版微信?」
推特公司据当地时间4月4日提交给法院的文件显示,已被直接并入一家名为X公司的母公司。此前马斯克曾表示,收购推特将加速超级应用“X”的开发。早在当地时间4月11日,马斯克发布...
日期:04-13
你好,云中台!云上新零售,智选MC3
  新零售浪潮下,企业的单一销售渠道已无法满足客户多样化购物需求,只有打造与商品属性相匹配的零售场景和体验,满足用户的差异化需求,才是最佳的零售业态。零售品牌应该打造...
日期:07-16
“先涨价再降价”老套路为何难禁止「先涨价再降价是提高了还是降低了」
;  张涛  10月24日晚8点,各大电商平台的“双十一”预售正式开启,今年“双十一”大促进入实质性阶段。近日有网友发现某平台在售的手机在悄然涨价。山东的沈女士爆料称,某品...
日期:10-28
红杉中国沈南鹏2020投资的上市公司「福布斯中国发布2022创投人100 红杉中国沈南鹏第一」
12月29日 消息:今日,福布斯中国发布了2022创投人100榜单,据悉,这是福布斯中国连续第16年对活跃于中国大陆市场的创投人进行独立调研,并在200余家创投机构所推荐的投资人样本中评...
日期:12-29
李彦宏:中国搜索引擎还有发展空间(李彦宏创建的最大中文搜索引擎)
  近日,百度CEO李彦宏接受《环球时报》采访时称,中国的搜索引擎产业正处于高速成长阶段。中国互联网其实没有特别多的进入门槛,谁要想办一个搜索引擎,估计没有人拦着。并预测...
日期:07-29
22.5亿张,电子化率99% 浙江区块链财政电子票据全覆盖「2018年首张区块链电子发票」
12月16日 消息:近日,从浙江省财政票据管理中心了解到,浙江自2019年探索电子票据上链以来,累计开出22.5亿张区块链电子票据,财政票据电子化率达99%,均居全国第一,实现了全省机关企...
日期:12-16