您的位置:首页 > 互联网

Meta 开源多感官人工智能模型,整合文本、音频、视觉等六类数据

发布时间:2023-05-10 18:19:13  来源:互联网     背景:

IT之家 5 月 9 日消息,Meta 公司发布了一个新的开源人工智能模型 ImageBind,该模型能够将多种数据流,包括文本、音频、视觉数据、温度和运动读数等整合在一起。该模型目前只是一个研究项目,还没有直接的消费者或实际应用,但它展示了未来生成式人工智能系统的可能性,这些系统能够创造出沉浸式、多感官的体验。同时,该模型也表明了 Meta 公司在人工智能研究领域的开放态度,而其竞争对手如 OpenAI 和谷歌则变得越来越封闭。


该研究的核心概念是将多种类型的数据整合到一个多维索引(或用人工智能术语来说,“嵌入空间”)中。这个概念可能有些抽象,但它正是近期生成式人工智能热潮的基础。例如,人工智能图像生成器,如 DALL-E、Stable Diffusion 和 Midjourney 等,都依赖于在训练阶段将文本和图像联系在一起的系统。它们在寻找视觉数据中的模式的同时,将这些信息与图像的描述相连。这就是为什么这些系统能够根据用户的文本输入生成图片。同样的道理也适用于许多能够以同样方式生成视频或音频的人工智能工具。

Meta 公司称,其模型 ImageBind 是第一个将六种类型的数据整合到一个嵌入空间中的模型。这六种类型的数据包括:视觉(包括图像和视频);热力(红外图像);文本;音频;深度信息;以及最有趣的一种 —— 由惯性测量单元(IMU)产生的运动读数。(IMU 存在于手机和智能手表中,用于执行各种任务,从手机从横屏切换到竖屏,到区分不同类型的运动。)

未来的人工智能系统将能够像当前针对文本输入的系统一样,交叉引用这些数据。例如,想象一下一个未来的虚拟现实设备,它不仅能够生成音频和视觉输入,还能够生成你所处的环境和物理站台的运动。你可以要求它模拟一次漫长的海上旅行,它不仅会让你置身于一艘船上,并且有海浪的声音作为背景,还会让你感受到甲板在脚下摇晃和海风吹拂。

Meta 公司在博客文章中指出,未来的模型还可以添加其他感官输入流,包括“触觉、语音、气味和大脑功能磁共振成像信号”。该公司还声称,这项研究“让机器更接近于人类同时、全面、直接地从多种不同的信息形式中学习的能力。”

小米13发布

Zoom营收

瑞银证券投行部

当然,这很多都是基于预测的,而且很可能这项研究的直接应用会非常有限。例如,去年,Meta 公司展示了一个人工智能模型,能够根据文本描述生成短而模糊的视频。像 ImageBind 这样的研究显示了未来版本的系统如何能够整合其他数据流,例如生成与视频输出匹配的音频。

对于行业观察者来说,这项研究也很有趣,因为IT之家注意到 Meta 公司是开源了底层模型的,这在人工智能领域是一个越来越受到关注的做法。

大裁员的背后


返回网站首页

本文评论
荣耀系列离开华为「荣耀一跃,要越过华为」
韩国人对三星文 | 芃麦出品 | 网易科技《态℃》栏目组“青出于蓝,也是时候胜于蓝了。”北京时间3月1日0时,西班牙当地时间2月28日17时,荣耀CEO赵明面向网易科技等媒体如是说道...
日期:03-01
iPhone备忘录被曝莫名清空 苹果回应:将尝试帮忙恢复_我的iphone备忘录突然清空
10 月 10 日讯:针对“苹果备忘录被莫名清空”的情况,苹果客服回应称,会尝试在系统中帮忙恢复,如无法恢复将反馈给工程师。马斯克的火箭载重苹果在俄罗斯销量...
日期:10-12
雅虎和亚马逊适合 收购Hulu估值将超20亿美元(雅虎10亿美元对阿里的影响)
  北京时间6月24日消息,Hulu的潜在买家包括雅虎、亚马逊,估值可能为50倍市盈率(一段时间股票的价格和每股收益的比例),因为雅虎和亚马逊想拥有下一个Netflix。   Hulu的董事...
日期:07-30
一个援藏村书记和猪八戒网的小故事,看农产品如何更好地走出乡村
  2月21日,《中共中央国务院关于全面推进乡村振兴加快农业农村现代化的意见》,即2021年中央一号文件发布,文件指出要实现巩固拓展脱贫攻坚成果同乡村振兴有效衔接,要让广...
日期:07-16
区块链第一股业绩虚实调查_197只区块链概念股真假成绩单:真落地不足30%
据锌链接了解,这些"区块链"上市公司,其公司主营业务并非区块链,而且真正有落地应用的只占少数,大部分公司还停留在探索阶段...东方财富Choice数据显示,10月28日,A股区块链概念板块...
日期:08-01
女子戴金手镯做核磁共振:手腕被烫出一圈水泡「做核共振为什么戴在手上的金镯跟着振动」
今日消息,据沸点视频报道,山东德州女子称戴金手镯做核磁共振,手腕被烫出一圈泡。微信搜索市场份额这位女子表示,手镯自己是按千足金克重买的,做核磁共振前问过医生,医生说的没事,所...
日期:02-13
是谁催生了野生景点旅游热?「是谁催生了野生景点旅游热点」
  来源:法制日报  ● 近年来,随着露营日趋火热,野山、野水、野地方成了博主的流量密码,吸引不少游客为“野趣”前往打卡。但这些地方由于缺乏配套设施,危险重重,一些事故频频...
日期:09-08
小米雷军现身上海车展 参观蔚来、小鹏、极氪等展台「小米 雷军 造车」
4月19日 消息:今日,小米创始人雷军现身上海车展,参观了蔚来、小鹏、极氪等展台。荣耀30评测麒麟985据报道,小米汽车计划于2024年上半年正式开始量产。小米创始人雷军曾表示,小米...
日期:04-19
槟榔经销商给商品垄断市场「槟榔口香糖兴起!公司5个月销售额超3000万元:号称“健康食品”」
今日消息,据新京报报道,槟榔衍生食品槟榔口香糖悄然兴起。经销商透露,一家以槟榔口香糖作为主推产品的公司,在过去5个月时间里,总销售额已达3000多万元。该经销商透露,这种槟榔口...
日期:10-18
大江大河2 dell_透过 《大江大河2》看戴尔前世今生
  最新家用电视盒子排行榜:必备的家用电视盒子有哪些 融云音视频审核服务 解决应用对绿色通信的迫切需求 小米6a数据线支持33w快充吗奔驰纯电动车续航城市公共w...
日期:09-02
淄博烧烤营业时间「淄博烧烤店停业三天 老板:保命要紧 店员都累趴了」
一家山东烧烤店因员工超负荷工作暂停营业三天。视频显示,该店门口贴出了这样一则通知。该店老板杨先生表示,他、妻子及店内30余名员工因工作超负荷已累得难以继续,歇业是为了保...
日期:04-18
哈啰单车推出复工福利:所有用户下周能免费骑车7天(哈啰单车7天免费骑行)
  2月28日消息,哈啰出行今日发布的北京市骑行数据显示:自2月10日企业复工首日以来,北京的共享单车需求量持续攀升,全国各地的用车需求量也同步增加。   在当下的疫情防控关...
日期:09-14
网购资金为何屡遭打劫? 360提醒谨防十类“低价”网购诱饵
  (2010年12月29日 北京)1.44亿网购人群,4300亿网购金额,2010年网上购物市场规模相比去年猛涨一倍。然而,近期多家杀毒厂商却纷纷对网购安全性亮出“红灯”。网购资金为何屡遭...
日期:07-25
男子高烧近40度睡觉 掀被子直冒烟!网友集体被吓到「被子被楼上烟头烧了」
据梧桐Video报道,12月13日,河南郑州,一男子发烧39.2℃后睡觉,没想到掀起被子发现竟然直冒烟。当事人田先生称,头一天晚上发烧,当时吃了退烧药,就在被窝里睡着了。后来觉得实在是太...
日期:12-14
《庆余年》为网络文学IP改编再开新局面_庆余年根据谁的小说改编
  时至年末,网络剧又掀起了一波观剧热潮。《庆余年》《鹤唳华亭》《剑王朝》《梦回》等剧相继上线,在严寒冬日营造起热烈的观剧氛围。其中,《庆余年》在收视热度和观众口碑...
日期:09-05
本田公布全新 HondaJet 概念飞机,可实现从纽约至洛杉矶不间断飞行_Honda飞机
  10 月 14 日消息,当地时间 10 月 12 日,本田(Honda)的飞机事业子公司 Honda Aircraft Company(HACI)在美国公务航空会议暨展览会(NBAA)上,展示了概念机型轻型公务机 Honda...
日期:07-17
Adobe将对上万种颜色收费:每年599元 不买自动变黑色「因为你的颜色设置是针对adobe」
Adobe经过这些年的发展,各种软件已经成了重要的生产力工具,尤其是PhotoShop的用户最为庞大。其作图、修图非常强大且方便,而且内置了RGB、CMYK、Lab 等方式自定义专色颜色,包括P...
日期:11-12
爱奇艺联合新派系修复电影《护士日记》入围戛纳国际电影节 技术助力经典传承
  4月27日,爱奇艺和新派系文化传媒联手修复的《护士日记》正式入围本届戛纳国际电影节“戛纳经典”单元,这部尘封半个多世纪的中国经典老片在经过高科技技术的精心还原修复...
日期:07-14
智在超越 百度影音强势升级
  近日,百度影音正式升级到beta 7 版,不仅加入了“精简模式”、“音频流切换”等新功能,还突破性的实现了对WebKit内核的支持,全面改版的网页播放界面,可谓操控自如。下面,就让...
日期:07-22
华为官网悄然上线EMUI 12:全新UI设计(华为官宣emui11)
  HarmonyOS推出之后,华为之前的EMUI似乎处于停更状态,外界认为华为应该是放弃了EMUI开发。不过本月初华为在俄罗斯发布了新机nova 8,显示预装了EMUI 12,证实了EMUI依然处于...
日期:12-10