您的位置:首页 > 互联网

RTE2024:聚焦Gen AI 时代的 RTE,声网发布 RTE+AI 能力全景图_声网 im

发布时间:2024-10-28 10:59:46  来源:互联网     背景:

通信世界网消息(CWW)10月25日,由声网和 RTE 开发者社区联合主办的 RTE2024 第十届实时互联网大会在北京正式开幕,本届大会主题为“AI 爱”,覆盖AI、出海、社交泛娱乐、IoT、Voice AI、空间计算等20+行业及技术分论坛。今年是声网成立的十周年,也是 RTE 大会的第十届。十年间,实时互动从“理念”发展成一个“行业”。实时互动技术不仅助力社交泛娱乐、在线教育、IoT、企业服务等几十个行业、数百个场景实现了跨越式成长,也支撑了诸多互联网风口的进化,从过去的电商直播、互联网医疗、秀场直播到如今的大模型,都离不开 RTE 能力的参与和赋能。

在全新的生成式 AI 时代,RTE 与 AI 也将迎来更多可能性。25日上午的 RTE2024 主论坛中,声网创始人兼 CEO 赵斌、Lepton AI 创始人兼 CEO 贾扬清、声网首席科学家、CTO 钟声分别带来主题演讲。赵斌分享了声网十年以来专注实时互动行业的深刻洞察,以及他对 RTE 在生成式 AI 时代下未来发展的趋势判断。贾扬清则站在 AI 基础设施的视角下,分享了他对 AI 应用、云、和 GPU 算力云技术的独到观点。钟声的主题演讲聚焦在对实时 AI 基础设施的探讨上,并分享了 AI 与 RTE 结合的前沿技术实践。

声网tony

赵斌:生成式 AI 将驱动 IT 行业四大变革

生成式 AI 正在驱动 IT 行业发生大变革,赵斌认为,这一趋势主要体现在四个层面:终端、软件、云和人机界面。在终端上,大模型能力将驱动 PC 和 Phone 往 AI PC 和 AI Phone 的方向进化。在软件上,所有的软件都可以、也将会通过大模型重新实现,并从 Software with AI 发展至 AI Native Software 。在云的层面,所有云都需要具备对大模型训练和推理的能力,AI Native Cloud 将成为主流。此外,人机界面的主流交互方式也将从键盘、鼠标、触屏变成自然语言对话界面(LUI)。

随着生成式 AI 成为下个时代 IT 行业进化的主题,RTE 也成为了多模态应用和基础设施中一个关键的部分。10月初,声网的兄弟公司 Agora 作为语音 API 合作者,出现在了OpenAI 发布的 Realtime API 公开测试版中。

在此次大会中,赵斌表示,声网与 MiniMax 正在打磨中国第一个Realtime API。赵斌也展示了声网基于 MiniMax Realtime API 打造的人工智能体。在演示视频中,人与智能体轻松流畅的进行实时语音对话。当人类打断智能体并提出新的疑问时,智能体也能够非常灵敏的快速反应,实现了与人类自然流畅的对话。

在生成式 AI 的大潮下,RTE 将会提供更为广阔的空间。赵斌也在分享中宣布,声网正式发布了 RTE+AI 能力全景图。在全景图中,声网从实时 AI 基础设施、RTE+AI 生态能力、声网 AI Agent、实时多模态对话式 AI 解决方案、RTE+AI 应用场景五个维度,清晰呈现了当下 RTE 与 AI 相结合的技术能力与应用方案。生成式 AI 与RTE 结合带来的场景创新,将成为下一个十年的主题。

过去十年,声网不仅见证并推动了 RTE 从一个理念变成一个行业的过程,更身体力行的打破了国内实时音视频领域的三无状态。赵斌称,10年前行业内没有行业会议、专业书籍、以及专业媒体和社区。如今,RTE 大会迈入第10年,声网也于今年8月正式出版行业首本系统介绍实时互动的技术型科普图书《读懂实时互动》,同时,RTE开发者社区也持续繁荣,加速推动。

贾扬清:AI 是云的第三次浪潮

随着 AI 技术的发展,AI 时代的大模型应用开发、AI 云、以及 GPU 等基础设施建设逐渐成为热门话题,也成为了支撑整个行业发展、催生新应用诞生、新商业价值实现的基本底座。Lepton AI 创始人兼 CEO 贾扬清在 RTE2024 主论坛上分别从 AI 应用、云、GPU 算力云技术以及企业大模型自主性等层面带来了他对 AI 基础设施进化的解读。

针对 AI 应用,贾扬清指出,今天是最容易建设 AI 应用的时代,越是简洁的 AI 模型思路越容易产生优秀的效果。AI 能力加持后,应用本身的开发范式也在从数据、模型、应用构建三个维度发生变化,未来的应用开发将从“以流程为中心” 转化为“以模型为中心”。

除了 AI 应用层面,传统的云架构也在大模型、GPU 优化等需求的催化下发生了翻天覆地的变化。贾扬清认为,AI 是云的第三次浪潮,继 Web 云、数据云之后,AI 将成为第三朵云。AI 云有以下三个特征:算力会成为智能的基础、AI 云需要大量计算与大规模的异构集群,以及少量但高质量的通讯。总体而言,云的产品形态,本质是计算和传输的平衡。贾扬清指出,在 AI 云的形态下,实时的交流和智能的结合在用户体验环节非常重要。毫不夸张的说,实时将直接与生产力划上等号。

特斯拉电动重卡牵引车

企业在构建自己的大模型自主性上,到底该如何决策?贾扬清强调,企业应该将开源和闭源大模型都纳入考虑范畴。采用开源模型+定制化的优势不仅仅是具备更强的可定制性,还有更低的成本以及更高的速度,开源+定制化能够达到比闭源模型更好的效果。 

声网 im

钟声:分布式端边云结合的AI系统将成为现代基础设施的基本形态

在已经到来的 AI 时代,现代化基础设施应该是什么样?声网首席科学家、CTO钟声提到,大量用户设备往往会先接入边缘节点、并在需要的时候再接入云端,数据将在端设备、边缘节点和云之间往返传递。AI 时代的数据中心会包含以大量异构算力组成的超级计算集群(SuperScaler)。但是,停留在仅依赖超级计算集群的系统是远远不够的,万亿参数、多模态引入所造成的高昂计算成本、缺乏机制约束的数据隐私保护、几秒钟的延时都将阻碍大模型的普惠,极大地限制其在很多场景下的应用。

钟声认为,分布式端边云结合的 AI 系统将有效解决这些痛点。这个系统将把计算和传输在各节点做合理地配置,系统会智能地以自适应的方式把任务编排到端与边上执行,非常有效地降低了成本,同时提供了更低延时(低于1秒级的响应速度)、更高网络抖动容忍度、优秀的抗噪声能力,并且完整的用户数据只会保留在端上。

分享过程中,钟声还在大会现场演示了一个由STT、LLM、TTS 、RTC四个模块组成的端边结合实时对话AI智能体,这也是全球首次有厂商在比日常实际场景更具挑战的环境下展示实时AI 对话能力。大会现场观众规模超过千人,面临复杂的噪声、回声、麦克风延迟等困难,但智能体与钟声的互动仍然表现出了优秀的对话能力,在普通5G网络环境下实现了流畅、自然、有趣的双向实时对话,对话模型的极快响应速度、及时打断与被打断的自然程度、对抗噪声能力、遵循语音指令做等待能力都非常突出。

正如钟声在最后分享的,随着端设备的多样化以及能力的提升,AI 基础设施会变得更优化合理,使得 AI 无处不在,AI助理、AI分身帮助我们有效缓解时间稀缺性,改善工作效率和生活体验。

圆桌:AI 的6000亿难题,从基础设施到商业化落地

AI 的6000亿美元难题,一直都是整个行业非常关心的话题,在圆桌讨论环节中,Lepton AI 创始人兼 CEO 贾扬清、MiniMax 合伙人魏伟、面壁智能联合创始人&CTO 曾国洋、Hugging Face 工程师王铁震、Agora 联合创始人 Tony Wang 五位嘉宾一起探讨了从 AI 基础设施到 AI 商业化落地的机会与挑战。

芯片工程师,百万年薪算多吗知乎

针对商用大模型和开源大模型未来的发展趋势,贾扬清分享了两个核心观点:其一,同等质量模型的Size会变得越来越小,计算效率会越来越高,模型架构也会变得更加开放和标准。其二,除了极少数头部公司之外,越来越多的企业会采用开源架构来做下一代模型。因此,开源架构的应用会变的越来越普遍,通过开源架构训练出来的模型也都会有各自不同的风格。

声网agora官网

苹果玻璃盖板碎了

王铁震则表示,我们将在未来看到越来越多 Infra 和 Realtime 的工作,大家不仅需要关注开源模型本身,还需要重视开源模型的基础设施和数据闭环,才能把开源模型跑得更好、更快。Realtime 需要TTS、也需要大模型,如果能够通过一些方式放在一起,放在边缘侧、离用户更近的地方,才能产生非常好的效果。

关于如何看待音视频多模态模型的实际应用潜力,魏伟表示,随着多模态的出现,生成式人工智能的边界一定会被继续拓展,并加速这一产业的变革。从产品和用户服务过程中魏伟发现,文本、语音、音乐、视频这些模型可以很好的帮助艺术、影视、音乐等领域的创作者极大地提高效率,并为他们提供新的思路和方法。

针对大模型技术巨大的成本使用问题,曾国洋分享到,随着技术的前进,算力一定会变得越来越便宜,相同能力的模型规模也会变得越来越小,但算力成本优化会最终转化为训练更强大的模型。真正达到 AGI 水平之前,我们只能感受到模型在变得越来越强,很难感受到成本的变化。他还提到,由于面壁智能是做端侧模型的,所以很关注如何让模型在端上跑得更快,在实际部署过程中,他们会用各种量化压缩甚至是稀疏化方法去优化实际部署的开销。

罗敏创业故事

总结来说,Tony Wang 认为想要推动 AI Infra 到模型、再到商业化落地,技术驱动和成本是最核心的两个点。此外,在产品真正走向市场的过程中,流量和口碑也是关键。

过去十年,声网不仅见证并推动了 RTE 从一个理念变成一个行业的过程,更身体力行的打破了国内实时音视频领域无行业会议、无专业书籍、无专业媒体及社区的三无状态。自此,RTE 大会迈入第10年,行业首本系统介绍实时互动的技术型科普图书《读懂实时互动》于今年8月正式出版,RTE开发者社区也正在秉持着“开放、连接、共创” 的理念加速实时互动和 AI 的共生。

未来,声网将继续和大家一起,站在全新的起点、拥抱繁荣且充满挑战的 AI + RTE 新时代。


返回网站首页

本文评论
四川考虑氢能源汽车高速完全免费:山东已开始_四川氢能与燃料电池
4月16日,四川省召开了研究进一步推动绿氢全产业链发展及推广应用工作会议。会上,四川交通运输厅相关负责人表示,下一步将积极挖掘政策空间,加大引导力度,探索氢能源汽车通行高速...
日期:04-18
元宇宙发布会_元宇宙大会探路产业前景数字人应用场景或先落地
来源:上海证券报   ◎王墨璞嘉 记者 罗茂林   8月18日,2022全球元宇宙大会在上海召开。大会探索元宇宙产业落地的高效路径,致力协助构建城市级、国家级、世界级元宇宙产业...
日期:08-20
米家无线除螨仪怎么样_远离皮肤瘙痒困扰,米家无线除螨仪还你健康好睡眠!
  正值伏天,进入了一年中最热的阶段,炎炎夏日气候高温潮湿也正是各种微生物异常活跃的季节,螨虫在这个时间也日易滋生,很多皮肤敏感的人在这个时间会出现各种皮肤疾病,尤其是...
日期:07-14
ios更新了rc版还能更新正式版吗RC准正式版正在路上 苹果发布iOS-18 Beta 7更新
来源:中关村在线苹果今日发布了iOS 18的开发者预览版Beta 7更新,版本号为22A5346a。此次更新标志着距离iOS 18的正式版发布又近了一步,因为这次的版本号以字母"a"结尾。知名苹...
日期:08-22
上海发布标准化吸烟标识 统一视觉标识和引导标识
为了响应第36个“世界无烟日”的号召,上海市健康促进委员会办公室、上海市健康促进中心、上海市控制吸烟协会首次推出了国内最先进的标准化室外吸烟点标识和引导标识。本市从...
日期:05-29
佳明GarminMove系列智能手表为你提供全天候心率监测(佳明(garmin)运动智能手表)
  随着科技的发展,智能手表的配置越来越高,功能也越来越全面。佳明Garmin今年全新发布的GarminMove系列智能手表,不仅具备时尚的设计外观,并且拥有强大的健康追踪及运动...
日期:05-18
传音控股老板哪里人「曝传音控股多发30%年终奖 内部人士回应:非公司发文」
快科技1月26日消息,据媒体报道,根据国际数据公司(IDC)发布的2023年度全球手机出货量榜单,传音手机以0.949亿部出货量占据了8.1%的市场份额,再次进入全球前五。网传传音发布的2023...
日期:01-26
著名配音艺术家苏秀去世 享年97岁:曾为上影动画《天书奇谭》配音
1月8日消息,据主持人曹可凡发文证实,1月7日19点26分,上海电影译制厂译制导演、著名配音演员、作家苏秀因病去世,享年97岁。据了解,苏秀1926年出生于长春,1950年起先后任上海电影制...
日期:01-08
苹果关闭ios15.3验证通道意味着","info":{"wordid":"7065965611965093156"}},{&qu
来源:中关村在线马斯克被告苹果公司已经关闭了iOS 16.6.1、iOS 17和iOS 17.0.1的验证通道,这意味着已经升级到新版本系统的用户无法降级到这些版本。据报道称,苹果于10月5日凌...
日期:10-05
AMD Anti-Lag 抗延迟技术被认定作弊:官方一刀切
AMD最近推出了增强版抗延迟技术Anti-Lag ,本意是玩游戏时减少输入延迟、提升平滑度,但效果适得其反,在一些网游中触发了反作弊机制。Valve、AMD就都官方确认,《CS2》里开启Anti-...
日期:10-19
联发科与百度合作 推进文心大模型在联发科硬件平台上适配
8月16日 消息:联发科技(MediaTek)宣布与百度合作,共同推进飞桨和文心大模型在联发科技硬件平台上的适配。双方合作将实现大模型在终端设备和云端的协同工作,为用户提供突破性的...
日期:08-16
坐飞机更便宜了!多家航司10月5日起下调国内航线燃油附加费_机票航空燃油附加费是多少
快科技9月4日消息,近日,多家航空公司宣布了一项重要调整,自2024年10月5日(出票日期)起,将下调国内航线燃油附加费。这一调整对于广大旅客来说,无疑是一个利好消息,将进一步降低出行...
日期:10-04
世界emoji日 玩转斗图尽在二三四五王牌输入法
  文字和语言是人们进行沟通和信息交流的主要载体。面对面的沟通,人们可通过肢体语言和丰富的表情让自己的意愿表达的更准确。而书面的沟通,尤其是线上沟通以静态文字呈...
日期:03-25
淘宝升级百亿补贴 全网低价商品或免佣金「淘宝百亿补贴爆料更低价」
5月15日 消息:在6.18活动到来之前,淘宝已经升级了其百亿补贴,并将入口设置在淘宝APP首页的菜单栏中。英伟达限制挖矿苹果airpods表现强劲出货量暴增同时,淘宝还大幅下调了商家...
日期:05-15
百度将举行“百度世界大会2023” 文心一言将再次升级百度搜索将全新亮相
10月8日 消息:百度宣布将在10月17日举行“百度世界大会2023”。对此,李彦宏透露,将在百度世界上“手把手教你做AI原生应用”,也将带来文心一言、搜索、地图、网盘等应用产品的...
日期:10-08
《王者荣耀》妲己九尾“收割”女玩家:实体手办1199元_王者荣耀九尾狐妲己
快科技4月30日消息,《王者荣耀》的【妲己-青丘九尾】皮肤于4月27日上线。很多女玩家纷纷入手,不过价格不菲,普遍要花几百元,有人甚至表示自己花了1200元才抽中。趁热打铁,王者荣...
日期:05-01
屏幕效果稳了!小米14曝光「屏幕效果稳了!小米14曝光怎么调」
据博主i冰宇宙透露,小米将在今年年底推出一款名为小米14的手机,该手机采用华星光电提供的屏幕,边框将比iPhone还要窄,实现了四边边框1mm的极窄设计,显示面积占比显著增大,为用户带...
日期:04-09
华为鸿蒙4.0确定7月7日发布 新功能来了「华为鸿蒙系统最新进展」
华为鸿蒙4.0将在7月7日的开发者大会发布,鸿蒙4.0会有非常大的迭代升级,系统会表现的更稳定和流畅,易用性也会增强。一加ace neo3之前余承东还曾剧透,鸿蒙4.0的车机系统将于今年...
日期:06-07
哪吒张勇祝贺马斯克喜提12子:哪吒的内饰适合婴儿 欢迎试驾_哪吒汽车ceo张勇
快科技6月27日消息,日前,哪吒汽车联合创始人、CEO张勇在其账号发布视频,公布了哪吒L的车载冰箱技术。据悉,该冰箱不仅能快速制冷、冰镇饮料,还具备50度保温制热功能,适合在带娃出...
日期:06-27
营收2879亿元」-同比增长7.6% 「京东2023年第二季度财报_京东2021二季度财报数据
京东集团2023年第二季度营收为2879亿元人民币,同比增长7.6%,净利润66亿元,同比增长50%。苹果复制粘贴提示其中,商品收入2338.55亿元,同比增长3.5%,包括:电子产品及家用电器商品收...
日期:09-17