您的位置:首页 > 互联网

回头看:Sora十问

发布时间:2024-02-20 12:32:15  来源:互联网     背景:

回头看:Sora十问 通信产业网|2024-02-20 09:18:19作者:党博文 胡媛来源:通信产业网

【通信产业网讯】(记者 党博文 胡媛)这个春节,最炸烈的,不是烟花,而是Sora。

大年初七,OpenAI发布的Sora,再次把生成式人工智能推向了新高度。这个名为Sora的革命性文生视频模型,标志着人工智能技术在视频生成领域的重大突破。更重要的,它把世界模型和虚实融合的数字世界未来,更逼真的呈现在你的面前。

那么,在热烈的Sora讨论背后,我们应该怎样理性认知,冷思考是什么?《通信产业报》全媒体记者特别遴选了业界最关注的十个问题,通过专家的采访,和你一起理解Sora以及由此应该认知的机会。

01

Sora本质是什么?

作为OpenAI公司开发的一款文生视频模型,Sora能够将用户输入的文本描述转化为相应的视频内容,不仅可以生成长达一分钟的视频,且能完全遵照用户的Prompt并保持视觉质量。自然语言处理、高清视频生成、遵循指令三大能力是其核心优势。作为文生视频模型,在模型方面,Sora模型基于扩散型变换器(diffusion transformer)架构,这是一种深度学习模型,能够将随机噪声逐渐转化为有意义的图像或视频内容。Sora通过训练,学会了理解和处理文本提示,将用户的描述转化为视频内容,它不仅能够生成具有连贯性的场景和运动的镜头,还能够模拟复杂的场景和角色表情,为视频增添更多细节和想象力。

iphone手机带美颜吗

02

Sora的技术核心是什么?

Sora这一技术的核心在于结合了自然语言处理技术和视频生成技术,其采用了先进的深度学习算法和大规模视频数据集进行训练,使得模型能够学习到视频生成所需的各种特征和规律,Sora模型通过深度学习和语义分析来理解并解析输入的文本描述,捕捉其中的关键信息和意图。然后,基于这些信息,模型能够自动生成符合描述要求的视频内容,在这之中,Sora模型因其具备强大的语义理解能力,能够准确捕捉用户输入文本中的细节和要点,从而生成更加精准、生动的视频内容,来满足不同领域、不同需求的创作者。

03

Sora的首批真实场景是什么?

目前,Sora模型的发布为以影视制作、广告创意、教育培训、社交媒体为代表的视频创作领域带来了无限的可能性和机遇。其中,在广告领域,广告商可以利用Sora快速生成符合品牌调性的宣传视频;在媒体行业,新闻机构可以利用Sora制作生动形象的新闻报道;在教育领域,教育机构可以借助Sora制作有趣的教学视频,提升学生的学习兴趣和效果。此外,Sora还可以应用于游戏、娱乐等多个领域。也正因此,Sora的发布对全球AI行业产生深远的影响,它将极大地降低视频制作的门槛和成本,使得更多的人和企业能够利用视频进行表达和传播,为更多行业带来全新的商业模式和服务形态。

04

Sora的版权和安全隐私问题怎么办?

事实上,Sora等文本到视频的人工智能项目在创作过程中涉及大量内容,自然引发版权问题。一方面,Sora在训练过程中可能使用了受版权保护的内容,这引发了关于如何合法使用这些内容的问题。另一方面,由于Sora能够生成高度逼真的视频内容,如果不加以限制和监管,可能会被滥用于制作虚假信息或侵犯他人隐私。在安全隐私上,由于Sora文生视频模型需要大量的数据作为训练样本,这些数据可能包含用户的隐私信息,如果这些数据被不当使用或泄露,就可能对用户的隐私造成威胁。

05

Sora将如何影响通信行业?

作为一款文生视频模型,随着Sora等类似应用的普及,视频流量将大幅增加,对固定及移动通信网络的带宽需求也将随之不断提升,同时,Sora等大型AI模型需要强大的计算能力和高效的数据中心网络来支持其运行,这意味着数据中心需要更高的带宽和更低的延迟来确保模型的训练和推理效率,最后则是为了减少数据传输延迟和提高用户体验,越来越多的计算任务将在网络边缘完成,这也将加速通信业对于边缘计算的建设。

06

Sora背后团队与应用限制如何?

Sora炸场,其背后技术团队也正在持续引爆关注。出乎意料的是,这支团队很年轻,两位负责人都是在2023年刚刚博士毕业,团队里甚至有00后选手,还专门招了艺术生,顶级人才持续星聚,惊得众人开始重新考量OpenAI的技术领先性。然而,尽管Sora的技术能力非常强大,但它目前还无法完全替代复杂的影视制作,例如,对于叙事复杂、多视角的《三体》这样的作品,Sora尚不能实现从概念到成品的完整制作。此外,就目前的展示内容来看,并不意味着它已经“读懂”了物理规律,Sora对真实世界的模拟还有很多提升空间。

07

Sora模型对算力需求有多大?

OpenAI发布的全新AI生成视频模型Sora,一方面,采用扩散模型+Transformer架构,需要通过超大量数据集来扩大模型规模并提高模型表现,对训练和推理端算力的需求提升非常明显;另一方面,视频模型的训练和推理需求预计比文本、图像又增加了一个维度,从而有望带来AI芯片持续增长的需求。此外,多模态大模型应用后,视频内容的传输预计带来网络带宽的升级。Sora模型从文本、图像迈入视频大模型,使用了大规模训练和超大数据集,是通向通用AI的里程碑,AI服务器、GPU等算力设备的需求预期被再次抬升到新的高度。据推测,整个Sora模型可能有30亿个参数,为此,OpenAI启动了“造芯”计划,以应对其庞大的计算需求。

08

Sora的“最佳试炼场”或将在元宇宙?

Sora横空出世,特别适合制作那些在现实中难以拍摄、对想象力要求特别高的内容,之前拍摄特效视频需要用到特殊技巧,现在只需要输入一段充满想象力的文字即可生成,Sora的最大贡献是作为革命性平台,极大降低了视频输出成本,这被一度看作是元宇宙发展的核心桎梏。随着时间的推移,Sora会推动AI生成视频快速规模化,AI生成视频、AI生成虚拟世界前景非常乐观,AI数字人、AI视频是元宇宙的重要支撑基础,大模型和元宇宙的结合,将推动元宇宙走近用户。

09

Sora有望成为“世界模型”?

OpenAI深夜放大招,Sora展现出的视频生成能力让网友惊呼“逆天”,“世界模型”“世界模拟器”成为Sora的重要标签。以前的AI视频,都单镜头生成的,Sora能在同一视频中设计出多个镜头,同时保持角色和视觉风格的一致性,这种级别的多镜头一致性,是Gen 2和Pika都完全无法企及的,Sora在训练过程中表现出了与其他模型不同的涌现能力,不得不说是个奇迹。另外,从投资角度来看,Sora背后的涌现能力为自动驾驶、设计等需要现实世界建模的行业也提供了明确方向。从技术角度出发,Sora带给业界最大的启发是DIT模型,即以Transformer为主干的扩散模型,尽管它们已经是非常成熟的技术,但之前很少有人将两者放在一起。可以说,Sora的效果已经完全跳出了用冷兵器短兵相接的时代,已经有了世界模型的雏形。

10

一批创新公司要“消失了”?

OpenAI的Sora文生视频模型自发布以来,引起了广泛关注和讨论。Sora模型能够根据文本描述生成长达60秒的视频,这一技术突破不仅展示了AI在视频内容创作领域的潜力,也预示着未来视频制作和消费方式的重大变革,Sora模型的推出,可能会加剧视频生成领域的竞争,无疑将对内容创作、媒体制作、娱乐产业等多个领域产生深远影响。值得关注的是,Sora是一个伟大的工程进步,距离商业化还有一段路要走,除了确保在关键领域占领导地位、突破技术、建立平台外,也会做垂类应用,创新公司仍有很大发展空间。此外,从OpenAI的论文不难看出,Sora帮助很多创业公司节约了数以千万计的探索成本,但同时也给创业者提供了很大的想象空间。

责任编辑:晓燕


返回网站首页

本文评论
计算机病毒检测_国家计算机病毒应急处理中心监测发现15款违法移动应用
  7月7日消息,据新华社报道,国家计算机病毒应急处理中心近期通过互联网监测发现15款移动App存在隐私不合规行为,违反网络安全法、个人信息保护法相关规定,涉嫌超范围采集个人...
日期:07-31
AI大模型开发会被卡脖子吗? 华为盘古3.0发布会现场回应「盘古al模块」
凤凰网科技讯 7月7日消息,2023华为云开发者今日召开。华为常务董事、华为云CEO 张平安发表主题为《AI重塑千行百业》的开场演讲。华为华为盘古3.0大模型正式发布。张平安在演...
日期:07-07
顺丰航空开通首条大洋洲航线 全货机已增长至84架「顺丰航空货运航线」
快科技8月21日消息,昨天上午,顺丰航空采用B747-400型全货机开通深圳=莫尔兹比港”国际货运航线,一批电气设备搭乘首航航班由深圳飞往巴布亚新几内亚首都莫尔兹比港,后续将投入当...
日期:08-22
转危为安!华为确定参加今年MWC大展身手:有望发布新旗舰P60系列「华为p60最新消息」
CES大展正在火热进行中,虽然主题是消费电子,但CES的视角主要集中在PC、AR、智能家电等领域,对手机关注较少。这个遗憾,将在2月底的MWC(世界移动通信大会)上得到弥补。iphone13主摄...
日期:01-05
AWE 2023盛大开幕 三星多款热门Galaxy智能手机重磅亮相_三星2022款手机
4 月 27 日, 2023 年中国家电及消费电子博览会(AWE 2023)于上海新国际博览中心盛大开幕。作为全球三大家电及消费电子展之一,AWE2023 以“智科技,创未来”为主题,吸引了多个重点领...
日期:04-28
长飞业绩快报:2022年净利润增长最高达69%_长飞公司
长飞业绩快报:2022年净利润增长最高达69% 通信产业网|2023-01-30 14:30:26作者:通文来源:通信产业网【通信产业网讯】1月30日,长飞光纤光缆股份有限公司发布了2022年年度业绩预...
日期:06-02
巨人网络辟谣史玉柱被警方带走:下午一直在上海总部开会_史玉柱巨人大厦事件
    4月24日消息,今日晚间,有传言称巨人网络董事长史玉柱在杭州被警方带走,并猜测与团贷网爆雷相关。对此,巨人网络官方回应称,这为恶意、不实谣言。   巨人网络称,“史总今...
日期:01-24
返利消费者 淘宝商城单日33.6亿成就购物狂欢节_淘宝商品下单返利活动是什么
【TechWeb报道】因为淘宝商城,每一年11月11日注定成为消费者心中固定的购物狂欢节。 今年刚过去的11月11日,淘宝商城在这天实现33.6亿支付宝交易额,是去年这一天的近4倍。这一...
日期:07-24
诺基亚g20评测「诺基亚G22柔和桃全新配色来了,可维修性设计,运行安卓14」
据悉,HMD Global在2023年推出了诺基亚G22,官方称其为一款主打高度可维修的手机,该设备最初有流星灰和泻湖蓝两种颜色可供选择。昨日,HMD正式宣布为诺基亚G22推出了全新的配色版...
日期:02-08
双11 iPhone14全系补货!叠券优惠700_苹果双12优惠卷
中关村在线消息:11月9日,据相关爆料,双11苹果产品最后一波优惠将于11月10日晚八点正式开始。这将是本年度入手iPhone最划算的28小时,Apple Store 官方旗舰店全系列新品也将补货...
日期:11-11
今年屏下摄像头「如今屏下摄像头已经足够成熟,为何在还没有迎来井喷式爆发」
为什么到现如今屏下镜头已经成熟了,很多手机厂商反而不做真全面屏手机了?感觉现如今屏下镜头技术已经很成熟了,拿刚刚发布的红魔8s Pro来说,几乎肉眼看不出区别,但是为什么之前追...
日期:07-17
必应移动版「必应 AI 聊天将增加「平滑滚动」效果:提升用户体验」
3月3日消息:据Neowin报道,微软正在测试新的必应聊天服务,增加了必应聊天机器人回应响应的内容风格。一个来自必应聊天用户的小更新请求也将在某个时候被加入,该请求要求在必应...
日期:03-03
腾讯的模仿与创新「但跟你想的不太一样 腾讯公布大模型最新进展」
【】千呼万唤始出来。6月19日,腾讯披露了大模型研发的最新进展。不过,不是类ChatGPT的C端通用大模型,而是To B的行业大模型。今年2月初,有消息称,针对类ChatGPT对话式机器人,腾讯...
日期:09-23
微软公司收购诺基亚_微软将向诺基亚支付10亿美元推广研发费用
  据华尔街日报中文网报道,据消息人士透露,微软将向诺基亚公司支付逾10亿美元,以推广以及开发基于Windows操作系统的智能手机。   此消息人士表示,诺基亚需要为每一部Windo...
日期:07-26
这篇文章很枯燥,但想赚钱的你,建议你看完。「文章枯燥乏味」
声明:本文来自于微信公众号 十里村(ID:shilipxl),作者:十里村,授权转载发布。各位村民好,我是村长。这篇文章很枯燥,但想赚钱的你,建议你看完。许多人都想赚钱,都想找到成功的秘诀。俗...
日期:04-01
停车老大难解决了!华为智界S7首发机械车位泊车辅助:超窄车位也不怕
快科技11月28日消息,在智界S7及华为全场景发布会”上,余承东介绍,智界S7首发泊车代驾功能。pixel中关村抖音我的主页的地图智界S7可一键开启泊车代驾功能,智能停车途中自主识别...
日期:11-28
小米13 Ultra全配色渲染图曝光:后置相机模组辨识度依旧拉满
我们知道,MWC2023(2023届世界移动通信大会)将会于2月27日在西班牙巴塞罗那举办,届时国内多家手机厂商都将参与,而小米也于日前宣布将前往巴塞罗那参加一年一度的移动通讯盛会,届时...
日期:03-01
oppofindx2屏幕多少hz「OPPO Find X6屏幕细节曝光:支持2160Hz PWM超高频调光」
中关村在线消息:近日,有数码博主曝光了OPPO新一代旗舰——Find X6系列手机的一些屏幕细节,他表示,Find X6系列将拥有3.3xmm的下巴,采用号称最高屏占比的单孔曲面屏,支持最高2160Hz...
日期:11-09
“快手村BA”贵州站直播总观看人次超3亿__贵州快手网红是谁
6月14日消息,快手数据显示,快手村BA贵州站直播总观看人次超3亿,相关话题视频播放量达4.5亿,同时,登上站内外161个热榜。马斯克发射火箭失败了多少次据介绍,历经10天的赛程内,来自贵...
日期:06-14
LightCounting:50G PON是F5.5G的关键
2023/5/25 17:52 LightCounting:50G PON是F5.5G的关键  水易 C114讯 北京时间5月26日消息(水易)近日,光通信行业市场调研机构LightCounting复盘了2023年华为全球分析师大会...
日期:05-26