您的位置:首页 > 互联网

平均mAP大幅提升,百度研究院夺得CVPR SoccerNet-v2足球视频理解竞赛双冠

发布时间:2019-03-14 10:33:24  来源:互联网     背景:

2021欧洲杯足球赛近日“姗姗来迟”,牵动了无数球迷的心。精彩的球赛视频背后,令人意想不到的是AI技术正在重塑体育视频产业的内容生产方式。

在近期举办的国际计算机视觉与模式识别顶会CVPR 2021上,视频理解领域最具影响力的International Challenge on Activity Recognition (ActivityNet) workshop旗下多个竞赛公布榜单。竞赛吸引了百度、阿里、字节跳动、腾讯、华为等知名企业和清华、北大、斯坦福、麻省理工学院、中科院等国内外高校和机构参与。其中,全球首个以足球比赛视频的全方位理解为目标的SoccerNet-v2足球视频理解竞赛中,百度研究院以绝对优势夺取了全部两项任务的冠军。

百度拿下全部两项任务冠军

本届竞赛所使用的 SoccerNet-v2数据集在足球理解领域规模最大,包括500场来自2014到2017年三个赛季的欧洲足球五大联赛和欧洲冠军联赛的视频,视频总时长达到764小时,人工标注达30万个,成为国际AI团队间衡量足球视频理解能力的重要标准。

双任务项目夺冠 大幅提升基线平均mAP

本届SoccerNet-v2竞赛下设了事件定位(action spotting)和回放溯源(replay grounding)两个任务。其中,事件定位(action spotting)是从足球比赛实况转播视频中找到一些关键事件并确定其发生的时刻。关键事件包括17个类别,涵盖进球、点球、任意球、红牌、黄牌、角球等重要事件,以及犯规、越位、射正、射偏等人类也难以立刻分辨的事件。同时有一部分事件甚至并未被直接拍摄到,需要根据上下文来推测,这也是对视频动作识别和事件检测能力的一个挑战。

回放溯源是(replay grounding)是把足球比赛转播视频中的回放片段和原始事件进行匹配。在足球比赛视频中一个精彩事件发生之后往往有多次回放,且回放和原始事件之间可能会相隔长达上百秒,拍摄视角也经常不同,能否将回放片段和原始片段匹配是对超长距离视频理解能力的一项考察。

百度研究院图文转视频VidPress团队专注于算法研究和应用创新,此次拿下两项任务的冠军,展现出了超群的技术实力。系统采用两阶段的方法,首先特征提取器提取足球视频特征,再将提取出的特征作为第二阶段具体任务模块的输入,进行事件定位或者回放溯源。

事件定位和回放溯源的系统流程

在特征提取阶段,团队认为在足球视频上微调过的特征提取器更有利于提升事件定位和回放溯源两个下游任务的表现,因此在SoccerNetv2数据上微调了五种预训练的特征提取器模型:TPN、GTA、VTN、irCSN和I3D-Slow。这五种特征提取器模型均是最近年来视频理解领域在分类任务上表现优异的模型,在标准数据集Kinetics-400上的成绩也名列前茅。

在五种特征提取器模型之上,团队也充分利用数据,设计了多种微调特征提取器模型的策略、开发了提取特征的新方法。得到每种特征提取器在足球视频上提取的特征后,将五种特征连接起来并做了归一化处理,使得优化后的特征对足球比赛视频具有强大表达能力,为后面的下游任务打下了坚实基础。

在事件定位和回放溯源阶段采用了Transformer结构。Transformer架构的特点是更清晰、更标准化、模型容量大、扩展性强,能适应计算机视觉、自然语言等多种业务。Transformer结构在这两个任务中体现了对视觉语义特征的精确的时序处理能力,优于基线算法中Siamese网络的学习能力和训练速度。在训练过程中,事件定位采用了mix-up数据增强,更高效利用了训练数据、降低过拟合。在回放溯源的任务上,模型结构的更换使得训练时间减少到原来的八分之一。

结合前述的视觉信息语义化特征,以及为新的任务订制的Transformer结构,百度研究院在竞赛成绩上取得了较大幅度的领先。在事件定位任务上,把基线的平均mAP由52.54%提升到74.84%,提高了22.3个百分点,是第二名提升的近两倍;在回放溯源的任务上,把平均mAP由基线的40.75%提升到了71.90%,提高了31.15个百分点,比第二名63.91%的成绩高出8个百分点。

技术“照进”现实应用 智能视频生成工具应运而生

百度研究院之所以能够在该项竞赛中脱颖而出,离不开基于大规模视频数据的算法能力技术积累。

该项技术有非常高的实用价值,可以大规模应用于体育赛事视频中,通过对全场比赛进行智能识别,可以在不需要人工介入的条件下,精准、实时地切分出进球、射门、犯规等动作片段。

基于此项能力,团队开发出了一系列应用工具并成功落地。

首先是行业领先的自定义足球精彩集锦生成工具。输入球员后选定比赛场次,即可自动生成这个球员的精彩瞬间视频集锦以及慢动作回放。目前这一系统已经落地在百度百科400多个足球球员和球队页面。

输入球员名称+比赛名称,生成该球员的视频集锦

其次,将文本语义理解与视频图像理解贯通,团队还搭建了足球图文战报一键转换视频平台。输入文字直播内容或者直播间地址,就能智能聚合生成对应的视频内容,提高了战报的生成效率和可读性。

平均mAP大幅提升,百度研究院夺得CVPR SoccerNet-v2足球视频理解竞赛双冠

根据文字直播内容智能生成对应的片段视频

此外,团队还建立了基于图像场景识别的智能视频生产线,该生产线可以快速理解上传的长视频,检测是否有进球、精准定位视频中的进球瞬间,并完成自动剪辑。

平均mAP大幅提升,百度研究院夺得CVPR SoccerNet-v2足球视频理解竞赛双冠

上传一段比赛视频,自动识别生成进球片段

基于在智能视频技术上的不断创新和积累,百度研究院在2020年初孵化推出了智能图文转视频工具VidPress,是业界首个支撑通用型、大规模的全自动视频生产技术。VidPress能够支持图文链接一键导入,自动自动实现配音、字幕、画面的视频内容生产,降低素材搜集、整理、匹配的时间成本。目前VidPress已作为百度大脑智能创作平台中的核心能力,为人民日报等多家媒体机构的智能视频生产赋能;为秒懂百科智能生成上千条球员精彩瞬间视频;为百家号和好看视频等平台的终端用户提供一键视频生成服务。百度大脑智能创作平台基于自然语言处理、知识图谱、视觉、语音的整合技术能力,为创作者提供多项能力,助力新闻生产的策、采、编、审、发全流程,全面提升内容生产效率。

全视频时代到来,各行各业对视频的应用、体验和效能都提出了全新升级需求,智能视频变化趋势背后的驱动力少不了AI的身影。无论是足球比赛视频,还是其他内容丰富、形式多样的视频内容,未来百度也将持续在相关领域的技术上不断突破迭代,并持续赋能应用与产品落地,为视频行业的发展与变革注入充足动力。

美国运营商频段


返回网站首页

索尼(SONY)PS5 PlayStation DualSense无线游戏手柄

广东第七届互联网+创新创业大赛获奖名单

游戏本显卡重要吗


三星2018年发布的平板

谷歌中国高管

乐视tv超级电视s50air

深度操作系统 20.2.2 发布:全新应用商店上线,支持安卓应用
2021中国自动驾驶专利排行榜TOP 100出炉,百度第一

返回网站首页

本文评论
特斯拉在美召回超4万辆车:过烂路后助力转向可能会失效「特斯拉汽车出现问题怎么处理」
特斯拉又要召回了。日前,据美国国家公路交通安全管理局(NHTSA)网站显示,特斯拉在美召回超过4万辆2017-2021年产Model S/X汽车。召回信息显示,车辆电动助力转向系统(EPAS)在崎岖道路...
日期:11-14
Google将在Android 2.2中提供Adobe Flash(google 2.0.apk)
  一些细心的Android系统用户已经发现,Google面向Droid和Nexus One的网页中已经出现了一个支持Flash 10.1网站的列表,例如英国广播公司和索尼电影视频等。   这基本确认...
日期:07-29
苹果发布iphone13优惠「iPhone14预售价现身:加价卖,6699元起,新增Plus型号」
  苹果已宣布将于北京时间9月8日凌晨1点举办“超前瞻”特别活动。据微博博主;@李昂昂昂啊;等晒出的图片显示,一些线下店开启了iPhone14系列的预售,不出意外就是前期的黄牛价...
日期:09-06
抖音:五金工具”类目保证金提高至3万元「抖音数码配件保证金」
11月4日 消息:11月3日,抖音发布《关于“五金工具”类目保证金调整的意见征集通知》,意见征集期为2022年11月03日—2022年11月10日。调整后,【五金/工具】下二级类目【电动工具...
日期:11-10
手机屏幕十年发展史(触摸屏手机发展史)
  (原标题::变化翻天覆地)       手机已经是我们日常必不可少的生活元素,甚至已经成为了我们生活的一部分,这十年间我们手中的手机发生了翻天覆地的变化,你还记得你十年前用...
日期:11-05
iPhone 14 怎么买便宜,咱们比比价_iPhone12怎么买便宜
iPhone 14 系列基础款和 Pro 款价格正在遭遇冰火两重天,很多小伙伴会私信小编问中关村村里是什么行情。那么咱们就来比比价,疯狂星期四的钱,帮你省出来。目前呢,iPhone 14 和 iP...
日期:10-15
摩托罗拉滚轴屏手机曝光,可自由调节屏幕大小「摩托罗拉折叠手机屏幕不平」
联想中国区手机业务部总经理陈劲暗示,摩托罗拉可能会推出一款滚轴屏手机。陈劲发出一张动态图片,并向粉丝询问:“如果不通过折叠的形式,做一款屏幕大小也可以变的手机,大家会喜欢...
日期:10-21
短视频与直播营销_微播易:揭秘知识+短视频营销策略,这才是它真实的爆发捷径
  当前是知识短视频营销的黄金时代。   近日,据报道,抖音将对一些知识科普类内容开放5分钟长视频权限,目前仅限知识类内容。足见,抖音对知识内容的重视程度!知识短视频正...
日期:07-15
寺库获私募股权公司 HCYK 、Timing Capital认购股权
财联社|新消费日报19日讯,今日晚间,寺库宣布与HCYK Corporation Management Partner和 Timing Capital Limited 各自签订协议。根据购股协议,HCYK将认购寺库3,750,000股A类普通...
日期:08-20
泡泡玛特的泡泡终于破了「泡泡玛特最近怎么了」
出品|虎嗅商业消费组作者|苗正卿题图|视觉中国“我们像一个链条一样做事,当一个项目从上到下都被看好时,它的效率和速度会很高;但当我们想要做一些新的尝试时,它可能会出现问题。”...
日期:09-18
通用汽车现在进入了能源行业的原因「通用汽车现在进入了能源行业」
通用汽车公司正在向房主、企业和公用事业部门推出新的能源产品系列,这是电动汽车攻势的下一步,目的是在制造和销售电动汽车之外创造收入,并直接针对特斯拉。下列属于蜂窝通信技...
日期:10-14
Honda发布安全超感Honda SENSING 360安全驾驶辅助系统
11月6日消息,在第五届中国国际进口博览会上,Honda发布安全超感Honda SENSING 360安全驾驶辅助系统。Honda对安全的追求从未止步,多年以来,Honda始终将用户的安全放在头等位置,不...
日期:11-08
抖音新潮好物夜中的一匹黑马——高端音响耳机Cleer_抖音同款音响
  近日,抖音电商携手湖南卫视打造的电商晚会——抖音新潮好物夜晚会,圆满落下帷幕。自9号晚会官宣以来,官方已陆续发布了视觉海报、概念片、等等物料,围绕“潮”、“惊喜”等...
日期:07-17
网易市值超越百度 成国内第五大互联网公司_【科技早报】网易市值超百度成国内第五大互联网公司
  据雅虎财经数据显示,截至周三美股收盘,网易市值(335.42亿美元)超越百度(331.36亿美元),成为国内第五大互联网公司。   周三,网易公司的股价收于262.13美元,当天上涨了1.2...
日期:01-09
IDC数据称iPad和亚马逊分别统领平板电脑及电子书市场_亚马逊iPad
  北京时间1月19日,据国外媒体报道,来自IDC的数据称,苹果iPad统领了平板电脑市场,其第三季度的销售量占同期所有平板电脑销量的90%,而亚马逊则占据了电子阅读器市场41.5%的份...
日期:07-25
华米科技成中国田径队官方合作伙伴 将共建联合实验室
  近日,全球领先的智能可穿戴公司华米科技(NYSE:HMI)与中国田径协会正式签署合作协议,成为中国国家田径队和中国田协在智能穿戴和智能手机行业的官方合作伙伴。双方将充分...
日期:08-21
快看 | 新氧科技发布上市后首份财报「新氧科技第二季度营收3.09亿元 同比下滑31.6%」
  讯 北京时间8月16日晚间消息,医美O2O平台新氧科技(Nasdaq: SY)今日发布了截至6月30日的2022年第二季度财报。财报显示,新氧科技第二季度总营收为3.091亿元(约合4610万美元),与...
日期:10-11
快手造芯,聚焦视频压缩
骁龙845旗舰机   文/郑可书 刘以秦   编辑/刘以秦   又一家互联网大厂开始造芯。   8月10日,快手StreamLake品牌发布会上,快手高级副总裁于冰宣布,快手研制出云端智能...
日期:08-11
谷歌 回归_谷歌回归内地胜算几何?
  在中国团购导航市场大佬争食之时,谷歌推出时惠团购导航,乍看是明知山有虎偏向虎山行,其实是对回归中国内地市场的一次侧面试探。谷歌是否找到了回归的时机?回归之路能否一...
日期:07-23
美媒都看不下去了:特朗普“围剿华为”是个严重错误_特朗普大乌龙!华为躺枪
  [摘要]对华为的围剿会让全球各地无辜的企业——其中包括华为的美国供货商——可能损失业务、面临破产或要承担极高的额外成本。引发盟友的不满,而中国只会加倍在国内生...
日期:08-06