您的位置:首页 > 互联网

马斯克科研「马斯克也逃不过科目三,阿里这个应用都要把外国人馋哭了」

发布时间:2024-01-09 14:08:40  来源:互联网     背景:

机器之心原创

作者:陈萍、大盘鸡

阿里开年整新活了。

最近,不少社交平台都被一种名为科目三的舞蹈视频刷屏了,摇花手、半崴不崴的脚,配合着节奏鲜明的音乐,这一舞蹈动作遭全网模仿。

对于有点舞蹈功底的人来说,学会科目三并不是一件很难的事,但对于四肢不是很协调的小伙伴而言,这可真是有点难度了。为了让广大网友学会这个舞蹈,还有人出了保姆级分解教程,声称几分钟速成大摇子。

其实,对于想要跳舞的你来说,根本不用真人出镜,一张照片就能化身舞蹈达人。不信,你看,一位小姐姐正在你面前大秀舞技。

你以为这是真人在跳舞,不,不,不!眼见不一定为真,其实这是根据照片生成的,而且只需一张照片就可以搞定。

现在技术已经发展成这样了吗?跳舞不需要真人,这是哪家出的黑科技,期待值直接拉满。

不卖关子了,谜底揭开,这项研究来自阿里。

苹果se有4.7寸屏幕的吗

在刚刚到来的 2024 年,阿里通义千问 APP 上线图片生成舞蹈功能,用户只需要输入一张图片,就能生成爆款舞蹈视频。

不管是科目三,还是鬼步舞、兔子舞…… 练习时长无需两年半,通义千问分分钟帮你搞定。有了它,让你瞬间变身舞蹈达人,再也不用担心自己没有舞蹈功底了。

操作过程也非常简单,打开通义千问 APP,然后在对话框中输入咒语全民舞王或者通义舞王,在弹出的界面中就可以体验了,最重要的是,不需要你花一分钱,完全免费使用!

该功能一经上线火爆国内外,在 AI 圈可谓是掀起了一波全民热舞小高潮,众多研究者纷纷玩了起来。X(原推特)上关于这项研究的浏览量动不动就上万。

不用自己出镜,上传照片就能化身舞王,这样的黑科技谁不想试一试呢。隔壁小伙伴的妈妈都羡慕哭了,老师,我们家子涵怎么不会。

其实,不管是子涵、还是子豪,不管是真人、还是纸片人,甚至是雕塑,通义千问都能让他们舞起来,简单到只需三步:

第一步选择自己喜欢的舞蹈种类,通义千问 APP 内置了不同的舞蹈模板,包括 DJ 慢摇、鬼步舞、蒙古舞、科目三、划桨步、兔子舞等十多种舞蹈,选择你喜欢的其中一种作为目标舞蹈。

nvidia rtx studio笔记本

第二步上传图片,图片的要求是全身照、正面站立、全身无遮挡、无俯仰角,图片的分辨率不能低于 500×500。你可以使用手机里保存的照片,也可以是现场拍摄的照片。此外,通义千问 APP 里还内置了照片模板供大家使用。

通义千问 APP 对上传照片的一些要求

最后一步,点击立即生成就可以了。

谁能想到,生成舞蹈视频已经简单到这样了。由于人人都可免费使用,一经上线,受到广大网友追捧。

效果到底怎么样,我们接着往下看。

谁都能跳?

我们先从古代人开始吧,这些只在历史文献中出现的人物,跳起舞来会是什么样子呢。想必大家都对桃园三结义的故事很熟悉,不知道三兄弟一起舞蹈是怎样的画面。

这不刘皇叔打了一辈子仗,马上就要来享受享受。接着奏乐接着舞,这波科目三跳得理所应当。由刘关张三兄弟发起的全民舞王比赛正式开始,你来品一品,谁跳得最好。

视频链接:

https://mp.weixin.qq.com/s/14WF1rI9qpDPlRbQawJ-rQ

哈尔滨不只有圣索菲亚教堂升起的月亮,背上小书包出游的企鹅,还有会跳兔子舞的梦露。东北 DJ 大哥见了都得夸一句,这兔子舞真不赖啊。

即使脖子上已经插了 99 根麻醉针,依然能跳最甜的舞。毛利老弟给大家带来《只想对你说爱你》,这灵活的身姿,妖娆的步伐,有没有让你心动呢?

2000 多岁的高龄选手高级军吏俑扭起了秧歌。新的一年已经到来,他用舞蹈传递喜气。

钢铁侠上演一段极乐劲舞,舞蹈动作不输真人,迈着欢快的小步伐,还以为是真人扮演的呢:

视频链接:

https://mp.weixin.qq.com/s/14WF1rI9qpDPlRbQawJ-rQ

玲娜贝儿跳起西域慢摇,胯部摆动流畅,手臂在空中跟着音乐节拍不停的变化:

视频链接:

https://mp.weixin.qq.com/s/14WF1rI9qpDPlRbQawJ-rQ

路飞扭起大秧歌,也毫无违和感:

马斯克 kishu

视频链接:

https://mp.weixin.qq.com/s/14WF1rI9qpDPlRbQawJ-rQ

这种大秀舞技的时刻,怎么少的了马斯克马老板,谁看了不说一句,马老板的科目三确实跳的很妖娆:

视频链接:

https://mp.weixin.qq.com/s/14WF1rI9qpDPlRbQawJ-rQ

跳起蒙古舞来,马老板也是有模有样:

视频链接:https://mp.weixin.qq.com/s/14WF1rI9qpDPlRbQawJ-rQ

上线即爆火的 Animate Anyone

通义千问之所以能够生成如此丝滑的舞蹈视频,背后离不开阿里在视频生成领域的深耕。不久之前,研究团队提出了一种名为 Animate Anyone 的算法,论文公布之初在国内外就掀起了一波不小的讨论高潮。短短一个月,Animate Anyone 在 YouTube 单个视频播放量已经高达 16 万次,而且这只是其中一位油管博主的视频播放量,如果统计全网,将会是一个很大的数字:

在这个视频的评论区,大家也是满屏的赞叹:太惊人了。

人工智能的能力太神奇了,之后忍不住又补了一句,真的太神奇了。

截至目前,该项目 GitHub 星标量已经达到 11 k 多。

论文地址:https://arxiv.org/pdf/2311.17117.pdf 项目地址:https://humanaigc.github.io/animate-anyone/

说到视频生成,从 GAN 开始,研究者们致力于将图像进行动画化以及进行姿态迁移的探索,然而,生成的视频仍然存在局部失真、细节模糊、语义不一致和时序不连续等问题。

为了解决上述问题,阿里提出了专为角色动画量身定制的新颖框架 Animate Anyone,它能无缝地把静态图像转变成动态的角色视频。通过巧妙设计的 ReferenceNet、轻量级姿态引导器和时间建模方法,Animate Anyone 解决了图像到视频生成中的细节不一致和运动不连贯等问题。Animate Anyone 框架如下:

Animate Anyone 具有以下特点:

首先,它有效地保持了视频中人物外观的空间和时间一致性; 其次,它生成的高清视频不会出现时间抖动或闪烁等问题; 第三,它能够将任何角色图像动画化为视频,不受特定领域的限制。

华为p40pro智慧多窗怎么设置

为了让大家更好地理解,我们以示例来说明。下图中同样是驱动一张照片动起来,直观来看,DreamPose 和 BDMM 在保留服装的精细纹理细节方面存在缺点,能看到明显的运动不连贯、闪烁等问题;而 Animate Anyone 就像真人模特在运动一样,衣服纹理保持良好,就连腿部衣裙的开衩都精准到位,把细节直接拉满了。

通过上述示例我们可以看出,由 Animate Anyone 驱动的视频生成技术,更好的保持了时序上的连续以及合理性,视频中人物的动作丝滑连接,没有跳跃或不自然的变化;生成的视频质量也非常逼真,人物的图像与视频内容能够保持高度的一致性;此外,视频的风格和色彩与原始图片一致性也较高。

结语

刚刚过去的 2023 年是人工智能技术迅速发展的一年,仿佛一刹那间,AI 就摇身一变,成为一个六边形战士,从一开始的会写小说、写代码、生成高清大片,到现在已经发展成生成视频了,AI 的发展速度已经超乎大多数人的想象。

作为引领新一代技术潮流的科技大厂们,自然是紧紧抓住机遇,不断进行创新与突破,给人们带来一次又一次的惊喜。

除了大语言模型继续刷屏外,视频生成技术也取得了重大进展,国外如 Runway 升级了 Gen-2 模型,带来了电影级别的高清晰度;Meta 发布视频生成模型 Emu Video,其视频的动态性比 Gen-2 有明显的提高;经典的文生图模型 Stable Diffusion 的公司 Stability AI 也发布了视频生成模型 Stable Video Diffusion (SVD) 等等。国内也在迎头赶上,如字节发布 Magic Animate,华为提出的 Animate124 模型等,都在视频生成领域进行不断的创新。

同样的,阿里也在视频生成领域交出了一份满意的答卷,将 Animate Anyone 集成到通义千问 APP,使得人人都可以进行无门槛的舞蹈合成,或许用不了多久,这一轮 AI 突破带来的变革将会触及更多人,我们将见证生成式 AI 对生产力和创新的颠覆。

在这场变革中,我们相信阿里会带来更多令人惊叹的应用。

参考链接:https://www.youtube.com/watch?v=8PCn5hLKNu4


返回网站首页

本文评论
“加特林”引爆烟花生意:提现金到工厂抢货,小摊贩一晚收入过万
声明:本文来自于微信公众号 Tech星球(ID:tech618),作者:习睿,授权转载发布。射速快、火力猛的城市烟花“加特林”,春节期间“C位”出道。在今年春节前,多地调整了烟花爆竹燃放政策...
日期:02-02
憾别搜狗,搜狐的失与得
  18年陪伴成长,搜狗终将告别搜狐。      来源|AI蓝媒汇   ID:lanmeih001   作者|关关   编辑|魏晓      7月13日,国家市场监管总局宣布,已无条件批准腾讯控...
日期:09-13
奢侈手表品牌|沛纳海匠心细节致敬海洋探险精神「沛纳海手表什么档次,沛纳海手表排名」
古往今来,冒险家们凭借智慧和勇气征服人类未曾到达的险境,对于他们来说,腕表也许是最后一道防线。在十大奢侈手表品牌中,沛纳海延续与深海探险有着不解之缘的丰厚制表传统,以帆船...
日期:07-14
总投资100亿元!重庆华韶智算中心一期项目开工_华韶数智科技
通信世界网消息(CWW)据重庆日报消息,9月20日,重庆市大渡口区举行2023年三季度重大项目集中开工暨投产活动。在开工的重点项目中,华韶智算中心一期项目占地面积107亩,总投资100亿元...
日期:09-22
网信办:重点治理仿冒他人企业上架APP和小程序等行为_仿冒网站向谁举报
4月28日 消息:中央网信办发布关于开展“清朗·优化营商网络环境 保护企业合法权益”专项行动的通知称,决定即日起在全国范围内启动为期3个月的“清朗·优化营商网络环境 保护...
日期:04-28
iPhone 14 Plus遇冷Pro卖爆:价格差1000元 你觉得值吗_iphone 11pro现在卖多少钱
10月7日,iPhone 14 Plus迎来首销,至此,iPhone 14全系机型已全部发售。与iPhone 14 Pro系列热火朝天的销售情况不同,iPhone 14、iPhone 14 Plus遭遇了前所未有的市场寒意,后者首发...
日期:10-12
鸿蒙升级nova「又一批鸿蒙3.0测试版名单开放,Nova老用户终于等到了」
鸿蒙Harmony 3开启了新一轮测试招募,招募报名截止到10月 13日,华为MatePad系列和华为Nova系列用户可以通过“我的华为 / 会员中心”App-首页-升级尝鲜入口进入报名。报名成功...
日期:10-18
又有巨头扛不住了!迪士尼宣布裁员7000人:省了55亿成本「迪士尼全球裁员」
2月9日消息,当地时间2月8日,美国迪士尼公司的首席执行官鲍勃伊格尔在公司财报电话会议上表示,迪士尼将裁员7000人,以节省成本。巴西iphone价格大众2026年停止燃油车据迪士尼去年...
日期:02-10
b站第三季度视频财报「B站公布第三季度财报:营收58.1亿元 日活用户突破一亿」
11月29日 消息:B站公布了截至2023年9月30日的第三季度未经审计的财务报。数据显示,第三季度B站总营收达58.1亿元,与2022年同期持平;净亏损为13亿元,较2022年同期收窄22%;调整后...
日期:11-30
突发!张勇卸任阿里董事会主席兼CEO,蔡崇信吴泳铭接棒「阿里ceo 张勇」
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:新智元,授权转载发布。一加9R游戏空间【新智元导读】阿里1+6+N拆分后,张勇将专注于阿里云业务发展,如今不再担任集团董事会主...
日期:06-20
金山办公2023数字办公生态伙伴大会召开 文档IP化赋能生态伙伴_金山办公ceo是谁
通信世界网消息(CWW)9月6日,金山办公“2023数字办公生态伙伴大会”在武汉召开,吸引了来自全国200多家生态伙伴参与。现场,金山办公分享了生态建设阶段性成果,发布面向生态合作伙伴...
日期:09-07
ChatDOC:一个基于ChatGPT的文件阅读助手_chm阅读查看器
10月24日 消息:ChatDOC是一个可以快速从文档中提取、定位和总结信息的文件阅读助手,能够理解文本、表格和图像。ChatDOC可以帮助用户从各种格式的文档中获取所需的信息,如.pdf...
日期:10-24
英伟达RTX 3060 Ti 8GB GDDR6X公版显卡曝光 标价369英镑_3070ti是gddr6x吗
VideoCardz 报道称,英国零售商 Scan 已在网站上列出了一款独特的英伟达 GeForce RTX 3060 Ti 显卡,可知其搭配了 8GB @ GDDR6X 显存、并以 369 英镑(约 2615 RMB)的价格出售。早...
日期:10-10
钉钉用户规模_钉钉宣布用户数破 5 亿
  10 月 13 日上午消息,在今日的 2021 钉钉未来组织大会上,钉钉对外宣布用户数已突破 5 亿,包括企业、学校在内的各类组织数超过 1900 万,并发布新的年度趋势关键词“数字生...
日期:08-14
第四代英特尔至强可扩展处理器,助力百度智能云新一代云服务器BCC实例性能升级
通信世界网消息(CWW)9月5日,在2023百度云智大会上,百度智能云宣布全面开售多款第六代BCC(Baidu Cloud Compute)云服务器实例并发布第六代弹性裸金属实例。得益于第四代英特尔®至...
日期:09-07
三星游戏电视玄龙骑士Z9即将上市,共同角逐《极限竞速:地平线5》的巅峰境界
近日,三星游戏电视玄龙骑士Z9 在京东开启新品预约登记享福利活动。该电视是三星游戏电视系列最 新产品,在前代游戏电视的强悍性能配置之上再次全面升级为超疾速游戏电视,让玩家...
日期:08-25
邵广禄: 5G+云+AI+X,迎接数字化新未来_书法家邵广禄简介
邵广禄: 5G+云+AI+X,迎接数字化新未来 通信产业网|2023-06-29 13:45:58作者:通文来源:通信产业网雅迪e7铅酸版72v缤钻【通信产业网讯】6月29日,以“5G云网新科技 数字经济新动能...
日期:06-30
翻译研究中的眼动追踪技术研讨班_眼动追踪技术:原理与应用 pdf
  由中国翻译认知研究会主办,河南工业大学外语学院承办的新时代创新背景下翻译传译认知国际研讨会暨中国翻译认知研究会第三届大会2018年5月在河南工业大学举行。会议期间...
日期:04-03
5999元起!华为Mate 60正式全款开售:1TB顶配版来了
快科技9月10日消息,订金预售多日的华为Mate60终于在今天开启全款购买,今晚18:08将在华为商城开售。同时,华为Mate60的12GB1TB版也已上架,售价6999元,有大存储需求的消费者可以入...
日期:09-11
钉钉6亿用户的哲学:产业互联网的海洋里,没有人是一座孤岛_钉钉生态圈
声明:本文来自于微信公众号 松果财经(ID:songguocaijing1),作者:在辉,授权转载发布。除了拥有大人口和大市场条件的中国,或许难有另一个国家再现数亿人共同投身产业互联网的场景...
日期:01-01