您的位置:首页 > 互联网

用AI“复制”另一个你?腾讯云推出2D真人小样本数智人

发布时间:2023-04-27 19:44:39  来源:互联网     背景:

如果让你用一句话简单描述下腾讯的“数智人” ,你会想到什么?“它既可以是多才的员工,也可以是吸粉的明星代言人。”这是腾讯云智能数智人产品总经理陈磊的答案。

2022年9月,在央视播出的《闪亮的名字——2022最美教师发布仪式》上,腾讯数智人“云萱”以节目主持人的身份亮相,其通过真实生动的形象和专业的主持能力,给观众带来了一场亮点颇多的节目体验。同年,适逢中国国家博物馆创建110周年之际,腾讯数智人“艾雯雯”走进国博展厅,开启国博“打工人”新生活,并将在今后通过不断的学习,肩负国博形象代言人和具备多个工作岗位能力的员工的责任。

而在2023年4月25日,通过腾讯数智人的支持,数字经济学者刘兴亮以短视频“亮三点”为例,展示了他的首个数智人分身。


图丨刘兴亮用小样本数智人生产视频(来源:资料图)

“这个形象近似真人,表情、唇型匹配自然,包括我的特色口音也模拟得惟妙惟俏的数智人,正是腾讯云智能小样本数智人。未来,不需要搭建拍摄场地,也不用提前化妆彩排,不受空间、时间限制,数智人可以随时随地帮我生成口播视频,解放我的生产力。”刘兴亮如是说。

推出2D真人小样本数智人,只需24小时即可为用户打造出专属数智分身

腾讯自2018年起开始研发数智人,一直以来都将“更智慧、更懂行”作为发展方向。陈磊解释道:“一个通过AI技术,能够提升智能性,更智慧。第二个是更懂行,我们进入到各种各样的行业和场景,做深入的场景集成,使我们在行业的技术诀窍里形成很强的积累,提升行业的服务效能。”

综观旗下数智人的整体产品矩阵,其形象类型非常丰富,覆盖3D写实、3D半写实、3D卡通、2D真人、2D卡通五种风格,能够掌握数百种肢体动作和细腻的面部情感表情,支持内容生产、形象资产管理等方面的服务。

腾讯研究院高级研究员宋扬表示:“整个数字人围绕着两点,第一是好看的皮囊,第二是有趣的灵魂。”



2D真人风格分为精品和小样本两种模式。前者主要面向客服、虚拟IP形象等场景,成本约在数十万、百万级别,需要一个专业主播在录影棚录制一到两天,才能完成形象的打造。

而本次沟通会上推出的数智人,是2D真人小样本数智人。其也是根据真人形象定制,但普通人只需要录制3至5分钟的视频,就能够生成属于自己的数智分身,人工成本、时间和效益等已经迎来了极大的改善。

具体来说,用户只需提交少量的样本数据进行AI训练,比如3分钟真人口播视频、100句语音素材,就能在24小时内打造出一个与真人形象、语音非常逼真的数智分身。


图丨2D真人小样本数智人(来源:资料图)

据此得到的数智人,既支持半身或全身形象展示,又能根据内容调整动作、手势、口型、表情等,还支持任意更换录制背景,应用场景的适用性得到极大的增强。

事实上,2D小样本技术是由3D技术来提供支撑的。腾讯优图实验室研究总监汪铖杰表示:“小样本数智人从直观上感受是2D视频,背后其实是3D人像在做支撑。从‘文本/音频’信息到‘3D人像驱动’再到‘2D人像视频’的模式,通过3D人脸结构的先验信息引入,使数智人口型、表情更到位,让小样本数智人形象实现‘皱纹级’还原。”

与此同时,小样本的背后是“大”,也即基于自监督技术,构建大的数据和模型,用大模型持续消化语音、文本、口型等更多的数据。

从声音复刻上看,小样本数智人基于腾讯自研的新一代小样本音色制定技术,以及深度学习的声学模型及神经网络声码器,能够有效改善传统声学模型语音韵律单一、语调平淡的问题,进而提升语音合成的精细化水平。

此外,为了进一步提高小样本数智人的品质,腾讯还运用了包括高精度人像分割、人像美化、视线矫正等多项视觉AI技术。

加速数智人向千行百业普及,向行业开放数智人工厂生产能力

如上所述,小样本数字人具备基于真人形象定制、人人可用的特点。那么,如果面向的是整个行业或C端用户,又该如何才能为每一个人打造独立专属的数智人形象呢?

为了降低数智人制作门槛,加速数智人向千行百业的普及,腾讯云智能提出了“AI+数智人工厂”的方向。

首先,在基础设施即服务层面,基于腾讯云强大的算力体系,提供强有力的支撑。其次,依托腾讯云TI平台这个一站式低门槛、低代码的训练平台。基于TI-平台即服务的能力,构建标准化、工业化的数智人生产工厂。该工厂覆盖数智人生产的全流程环节,集成了十余种AI算法。未来,即便是没有研发经验的普通用户,也能自行操作并快速打造出属于自己的、近似真人的分身。

不仅如此,腾讯云智能还面向行业开放“产、销、服”的一体化平台,将数智人工厂的生产能力开放给整个行业,赋能到每一个个体。使用者可以在腾讯云上开设账号、上传素材、下订单,生产属于自己的数智分身。在进行效果确认之后,还能在交互服务平台、播报服务平台上使用,通过数智分身进行实时的视频生产和交互服务等。

短短几个月,已经有十几家生态企业先后完成了腾讯云智能小样本数智人能力接入的签约,其中包括微媒数字会议、上海医微讯等企业。

作为一家产品咨询公司,微媒数字会议致力于为品牌提供营销活动数字化解决方案。其与腾讯云智能合作,为小红书营销讲师、拾意文化创始人苏歆打造了一个专属数智人,后者帮助苏歆完成了一套40多节培训课程的视频内容。

在此之前,同样的工作需要由包括稿件制作人、主讲人、拍摄人等在内的全套制作团队,用一个月的时间来完成。如今,不需要影棚、拍摄和背稿,只需通过数智人平台,输入语音或文本音频,即可快速批量生成由专属数智人出镜的系列课程视频,充分实现对视频内容产出的降本增效。

微媒数字会议创始人兼CEO天狐表示:“我们一直在和腾讯团队合作探索,如何帮助IP老师更快速地做出千变万化的内容视频,帮助媒体同学快速产出有意思的内容,避免同质化的内容在网上大面积传播。”

作为医疗行业数字技术的供应商,上海医微讯早期采用3D虚拟仿真技术,帮助医生进行手术模拟,帮助患者更好地学习和掌握医学知识,后来逐渐通过虚拟现实、AI直播等技术为医疗赋能。对于数智人在医疗领域的应用,该公司也有自己的想法。

波场联合创始人

首先,该希望通过数智人打通就医过程中各环节存在的障碍,比如,在就医者进入门诊大厅以后,帮助其快速挂号、诊室指引等。

其次,通过数智人为患者提供智能、情感的陪伴。比如,通过数智人声音克隆技术保存需要做喉部手术的患者的声音;为罹患老年痴呆的患者提供陪伴服务等。

同时,帮助医生开展医患教育和知识分享。比如,用数智人代替医生为患者进行相关知识的科普和培训。

此外,让更多的数智人扮演药企中的虚拟代表角色,促进药企的转型发展。

“这四个领域,赋能医生、赋能医院、赋能患者、赋能药企,每个场景都是巨大的,也是我们这样的公司希望一直能做的事情。”上海医微讯数字科技股份有限公司创始人兼CEO潘耿表示。

推动数智人应用快速落地,让其能以普惠化的发展形式走入千行百业,是腾讯云智能打造数智人业务的初心。未来,其将继续朝着提升自然语言处理、自动语音识别等AI技术、探寻丰富的应用场景、联合更多生态伙伴等方面前进,为数智人的发展开辟更广阔的空间。


返回网站首页

本文评论
”天府文创 锦绣云上”数字文创产业成都峰会圆满举办(天府文创城)
  为助力成都文创IP产业进一步做大做强,搭建产融对接平台,5月25日下午,由成都市文产办、四川省投资基金业协会指导,成都天府文创金融科技有限公司主办,成都市天府文创股权投资...
日期:02-15
京东app首焦展位_京东新首页内测,取消焦点图
  据亿邦动力报道,日前,京东开始内测首页改版,取消首页焦点图。   当首页焦点图取消后,首页的瀑布信息板块将上移。有服务商猜测,改版后的京东首页内容将更偏向短视频化。...
日期:06-25
京东618 广告_一支京东京造618的品牌广告片,道尽了生活的本质
  京东618全民狂欢节之际,京东旗下生活方式自有品牌“京东京造”携全新品牌TVC而来,以不同的生活方式为切入点诠释品质生活。   作为备受关注的京东自有品牌,京造立足于...
日期:07-14
iOS 16.1 Beta 4发布:iPhone 14 Pro灵动岛样式变了
在今天,苹果正式推送了iOS 16.1的Beta 4版,也就是测试的第四个版本,距上次发布只有7天的时间,而此次的最大更新就是iPhone 14 Pro和14 Pro Max的灵动岛颜色和样式都有变化。iPho...
日期:10-06
移动被曝拨电话拉联通用户转网:官方回应来了_移动转联通携号转网怎么办理话费
自从携号转网开启后,有运营商为了最大限度转化客户,甚至还有客服打电话给其他运营商用户推荐套餐。腾讯最成功的产品近日就有一位陕西西安的联通用户表示,自己接到了一个自称是...
日期:03-01
2019哔哩哔哩年度弹幕「哔哩哔哩公布2022年度弹幕:优雅」
12月15日消息,哔哩哔哩(以下简称“B站”)与中华书局联合发布2022年度弹幕“优雅”。B站自2017年开始发布年度弹幕,到今年已经是第六年。不同于前几年发布的年度弹幕“破防了”(20...
日期:12-15
剧版《三体》高热开播 腾讯会员年卡限时5.5折「三体电影播出了吗」
昨晚,《三体》电视剧终于开播,全剧共30集,腾讯视频非会员可看1集,会员可观看4集。据腾讯视频官方消息,《三体》上线仅1小时,站内热度值就突破2.5万,创下腾讯视频剧集首日热度最快破...
日期:01-16
华为2K新机能否延续光环?麒麟810+4800W四摄,与“机”俱来
  相信有很多网友都知道,近期很多手机品牌都陆续有下半年新机推出的消息,快的在7月就正式上市了,还有很多是在8月份发布上市。每家手机品牌一旦有新机推出,往往都会是网友们...
日期:11-04
潮宏基珠宝发布初个非遗花丝数字藏品_潮宏基艺术珠宝发布
比较近几年随着元宇宙、web3. 0 概念的兴起以及区块链等技术的发展,全球数字经济进入新的阶梯,这其中数字藏品无疑是很具有代表性的产物,于是各路玩家紧跟也时代潮流,纷纷布局数...
日期:09-06
Netflix 宣布结束 25 年 DVD 租赁业务,9 月底邮寄最后一张光盘
IT之家 4 月 19 日消息,流媒体巨头 Netflix 周二在一篇博客文章中宣布,该公司正在逐步关闭其 DVD-by-mail 邮寄租赁业务,这一服务已维持了大约 25 年。该公司表示,其 DVD 租赁业...
日期:04-19
百度好看视频的独家知识型网红:“国民律师” 周兆成
  “杀人女魔头”劳荣枝案开庭前一天,律师周兆成彻夜未眠。   他同劳荣枝的二哥、二嫂等人,在前一天就抵达了南昌。等待的时间格外难熬,周兆成陪着二哥用一整晚的时间,写...
日期:10-17
刘强东明州事件双方和解 称是误会「刘强东明州案件是怎么回事 视频」
凤凰网科技讯 10月2日消息,双方律师表示,刘强东先生和刘婧尧女士于2018年在美国明尼苏达的一次偶然事件所造成的误会,占用了大量的社会资源,也给彼此的家庭造成了深重的困扰。今...
日期:10-05
为家再添科技艺术感 三星OLED电视开启预先登记「三星放弃oled电视」
近日,三星官方商城开启OLED新品电视预先登记,这款受众多业内人士和消费者关注的产品将在 4 月 27 日正式上市。中航锂电融资120亿2023 年初CES展上,三星推出配备量子点技术、搭...
日期:04-14
深信服EDS存储全新“黑科技”,让PACS阅片“预判走位”_深信服的eds是什么
  近日,由国家卫生健康委医院管理研究所主办、《中国数字医学》杂志社承办的2021中华医院信息网络大会(2021CHINC)在杭州召开,来自全国各地的医疗信息化管理者、专家学者齐...
日期:03-26
特斯拉中国召回超10万辆车:快看看有没有你的_特斯拉召回近6000辆汽车
终于,今天上午据市场监管总局公告,特斯拉即将召回进口Model S、Model X及部分进口和国产Model 3电动汽车。苹果5c能不能用4g网络牵扯的车型如下,网友们快看看是否有你的车型生...
日期:11-26
太火爆!ChatGPT多次因访问量激增而宕机
最近,一款名为ChatGPT的智能聊天机器人火爆全球,短短两个多月就成功收获了超1亿用户,成为史上增速最快的消费级应用程序。2月8日消息,据媒体报道,ChatGPT因过于火爆而多次宕机。...
日期:02-09
荣耀新机X40 GT官宣:性能越级标杆 战神登场_荣耀x40怎么样
中关村在线消息:10月8日早,荣耀手机官方微博预热了一款即将推出的新机:X40 GT,Slogan为“性能越级标杆”。官方是这样评价这款新机的:“强悍性能,非凡操控 生来强大,实力霸屏”。谷...
日期:10-12
Pixel 7系列规格全面泄露 与你想象的完全一样_Pixel 7
Google将于10月6日推出Pixel 7系列,在过去的几个月里,我们已经看到了足够多关于这两款即将推出的设备的信息。有些是通过泄密,有些是通过Google自己,现在,即将推出的手机的整个规...
日期:10-04
RTX 4090惨烈掉帧后:又一作PC硬件杀手来了
今年的PC硬件杀手似乎特别多。开发商Arkane Austin更新了恐怖游戏《Redfall(红霞岛)》的最低硬件配置,有点过于傲娇。处理器最低i5-8400或AMD锐龙5 1600,16GB内存,显卡最低RX 580...
日期:01-28
不给同行嘚瑟!小米有品潮流板材太阳镜即将上线,性价比绝了(小米太阳镜评测)
  众所周知,小米公司一贯以来都是以出色的性价比打动消费者,用更少的钱提供更出色的产品让小米在消费者当中圈粉无数。随着小米有品的成立,小米产品的极致性价比也从手机、...
日期:12-28