您的位置:首页 > 互联网

小米语音识别引擎下载「小米AI实力再次得到验证,声音识别算法能力国际排名第一」

发布时间:2023-09-14 17:54:38  来源:互联网     背景:

通信世界网消息(CWW)近日,小米自研声音识别算法取得最新进展,算法模型领先其他机构,性能国际排名第一。小米是在 Google 发布的 AudioSet 音频标记任务中获得的这一突破。它是音频标记任务影响力最大的数据集,被认为是声音领域的 ImageNet (注:计算机视觉领域最著名的数据集,由著名学者李飞飞等主持发布),权威性颇高。

Google 将 AudioSet 数据集分为三个子集,前两个子集用于训练,被合并称为 “AudioSet-2M”。正是在这个合并后的训练集中,小米的声音识别算法模型首次在业界突破了50 mAP,刷新了音频标记技术指标,成为截至目前性能最好的模型。此外,小米还发布了一个 Mini 版模型,适合资源受限的场景。该模型的参数量被压缩到了原模型的约九分之一,远小于其他机构的模型,但性能却优于其他所有机构。

这项技术的突破意味着小米的声音识别算法能力再次精进,小米的众多智能硬件设备应用此项技术后,可以更敏锐地捕捉和识别环境声音,大幅提升硬件的智能化程度,从而为用户创造更加便捷的智能生活体验。

不仅如此,小米声音识别算法下的音频标记技术能力,还为业界的前沿研究提供了巨大的技术价值,有力推动了相关研发进程。

(小米自研声音识别算法性能国际排名第一)

小米算法应用场景广泛,AI赋能惠及普通大众

小米此次精进后的声音识别算法,具有极高的应用价值。它能够广泛应用于小米的智能设备中,大幅提升用户的智能生活体验。具体来说,音频标记算法能够识别广泛的环境声音,比如婴儿的啼哭声、动物叫声、汽车引擎声、爆炸声、烟雾警报、门铃声、水流声等,并让环境中的声音以文字等模态表达,让声音被“看”见。这可以让硬件设备更加智能,为用户带去更高效和更准确的声音识别体验。

以搭载在小米手机中的“小米闻声”功能来说,它可以监测 14 种重要的环境音,包括火警、婴儿啼哭、烧水壶声等,并以手机通知栏进行文字推送。这让听力障碍用户得以“看见”生活中的声音,与普通人一样享受智能生活的便捷。小米手环也可以同步显示和接收这样的声音信息。

智能家居设备上的应用则更加广泛。小米的声音识别算法已经应用于众多的智能家居设备中,比如米家摄像头的宝宝哭声监测功能,它能在监测到宝宝哭声的时候,实时向用户手机推送通知。Xiaomi Sound 音箱也搭载了声音识别功能,它能够识别家用报警器、婴儿啼哭、火警、流水、猫叫、狗叫等六种用户关心的家居环境声音。小米健康 APP 的睡眠鼾声监测,则可以帮助跟踪用户睡眠时的鼾声梦话。此外,针对家庭场景,小米还对音箱环境音的监测做了特别适配。比如为了避免一开水龙头就触发通知,打扰用户,研发人员将水流声的识别提醒条件改为一分钟之内多次监测到。

这项算法技术还广泛应用于小米机器人的研发中,大幅提升了机器人的感知能力。小米历时10个月全栈自研的第一代全尺寸人形机器人 CyberOne,可以识别 85 种环境声音,能够通过听觉感知 6 类、45 种人类情绪。而小米第二代仿生四足机器人 CyberDog 2 则可以识别 38 种环境声音,实现更强大的动态响应能力。

任泽平最新观点为自己而活

小米声纹识别的机型

小米强大的 AIoT 平台生态,为这项算法技术的应用提供了广阔的空间,这也是小米技术研发的先天优势,有丰富的场景推动技术迈向应用层面,让科技成果真正惠及普通大众。目前,小米的声学语音团队已将自研声学语音技术全面应用于小米手机、音箱、电视、耳机、手表、机器人等 79 个品类,共计 5000多款智能产品中。而小爱同学的月活跃用户数量则达到了1.15 亿,是世界上最忙的语音助手之一。

爱玛A500详细配置

长期深耕底层技术,小米推动行业前沿探索向前迈进

小米自研声音识别算法的突破,还为业界的前沿研究提供了巨大的技术价值。目前,业内已知的相关研究成果几乎都应用到了预训练的音频标记模型,用作音频编码,为音频领域的研究提供关键的音频信息提取能力。小米此次在音频标记任务上的出色表现,不仅充分彰显了技术实力,更直接推动了音频领域前沿探索向前迈进。

这是小米又一次展露出深耕底层技术的决心和实力。今年8月,小米对其科技战略进行了升级,提出“选择对人类文明有长期价值的技术领域,坚持长期投入”的科技理念,并指出了具体路径和原则,即深耕底层技术,长期持续投入,软硬深度融合,AI全面赋能。

事实上,历经十三年的发展,小米的技术研发已经从应用层面更多转向了底层技术层面。其中 AI 领域是小米长期持续投入的底层赛道之一。据悉,小米自2016年组建AI团队以来,人工智能团队经过7年6次扩展,人员规模已达3000多人。同时,小米 AI 技术能力也已经覆盖了视觉、声学、语音、NLP、知识图谱、机器学习、大模型、多模态等众多方向,并全面赋能了手机、汽车、AIoT、机器人等众多业务板块。今年4月,小米还正式组建了 AI 大模型团队,全面拥抱大模型,目前陆续有了一些应用尝试。其中第一个应用大模型,就是将智能语音助理小爱同学升级了大模型版本,并开启邀请测试。这次声学语音团队刷新行业音频标记技术指标,再次证明了小米强大的AI实力。

从更全局的视野看,小米的技术体系已蔚然成林,研发布局进入了12个技术领域,包括5G 移动通信技术、大数据、云计算及人工智能,同时基于智能制造,进入机器人、无人工厂、智能电动汽车等,总体细分领域达99项。小米的技术研发还有持续的资金保障,未来五年(2022-2026)研发投入将超过1000亿元。

小米还在持续通过多个层面的努力提升科技创新能力。9月11日,小米正式成立集团科协暨院士专家工作站,携手更多力量、汇聚更多资源进行关键核心技术攻关,加强基础性、前沿性研究和成果转化。

中国工程院院士丁文华指出,在以手机镜头为代表的成像技术领域,小米实现了光学镜头小型化的重大突破,是行业的佼佼者。小米已经牵头成立了智能图像处理北京市工程研究中心,他希望未来能够努力升级为国家工程研究中心。他还表示,期待与小米科技工作者团队共同开展关键技术攻关,推动行业向前发展。

在新的科技战略指引下,小米正朝向着世界科技巨头的目标锐意进取。而在历经十三年的丰厚积淀,又汇聚起强大外部科研力量后,小米势必迸发出更加强劲的创新活力。


返回网站首页

本文评论
NVIDIA 144核心超级CPU揭秘:3.5倍能效碾压AMD 128核心
2022年3月的GTC技术大会上,NVIDIA正式发布了首款数据中心CPUGrace,同时打造了两颗超级芯片,一是Grace CPU二合一,二是Grace CPU+Hopper GPU二合一。现在,NVIDIA官方详细揭示了Grac...
日期:01-21
200万的房子卖了能剩多少钱「男子将200万房子80元“卖”了 只为避免给父亲分钱」
江苏南通一男子为了避免给父亲分钱,竟然用80元的价格把自己的房子卖给了亲家母,引起了社会的广泛关注。据悉,这名男子名叫张清武,他和父亲张建文因为分家产问题打官司,法院最后判...
日期:03-24
送餐机器人带来的经济效益_餐饮行业掀起送餐机器人热潮 持续引发行业深刻变革
  年末将至,全国疫情再度反扑。据国家卫健委最新通报,新增本土确诊病例17例,其中河北14例,辽宁2例,北京1例。 反反复复的疫情,让原本以为终于熬过去了的餐饮人再度陷入迷茫...
日期:07-16
windows11 edge_微软 Win11/10 Edge Canary 浏览器 96 新增 PWA Hub 应用中心:全新设计
  10 月 12 日消息 据 MSPoweruser 报道,微软宣布为 Windows 11 和 Windows 10 上的 Edge 96 浏览器提供新的设计功能,目前只在 Edge 浏览器 Canary 频道中开启使用。   ...
日期:02-15
谷歌Facebook等希望美修改1986年通过隐私法案
  谷歌、Facebook等企业和团体希望说服美国议员修改1986年通过的《电子通讯隐私法》,以推动相关监控法案跟上互联网时代发展的步伐。(TechWeb配图)   新浪科技讯 北京时...
日期:07-24
三星最先进芯片「三星最新黑科技芯片发布,手机越用越慢或将成为历史!」
从去年开始,全球手机市场出现了大萧条,各个品牌的手机销量均出现了大幅下滑。今年关于年轻人为什么不愿意换新手机的话题也多次上了热搜,对于大家为什么不愿意换新手机的原因,网...
日期:09-17
马斯克 加班「每天17小时!马斯克回应51岁还在工作:我的工作对人类至关重要」
最近,马斯克因为重金收购了推特而引发关注和讨论。据报道,当地时间11月4日,51岁马斯克在巴伦投资大会上被问到自己为何还在工作。顺丰国际快递马来西亚他对此回应称:自己的工作...
日期:11-09
印度苹果手机工厂产能腰斩「印度制造iPhone正越来越多:占比快接近十分之一了」
快科技4月13日讯,印度制造的iPhone正变得越来越多。彭博财经估算称,截止今年3月,印度组装的iPhone已经超过70亿美元,这占到了iPhone全球份额的7%,高于其此前预判的5%。要知道,两年...
日期:04-13
快手-W:授出6.79万份购股权「快手 持股」
  快手-W9月27日公告,根据首次公开发售后购股权计划授出合共6.79万份可认购股份的购股权,惟须待承授人接纳方可作实。雷军说手机利润 苹果14 promax可以以旧换新吗...
日期:09-28
快手商家号战“疫”行动八大举措史上最详细指南
  为响应快手商业化的“暖春计划”, 快手商家号开展战“疫”行动,推出八大举措,配合多项减免和扶持政策,为有商业诉求的合作伙伴提供解决方案,携手合作伙伴共克时艰,化危为机,共...
日期:04-11
y400联想笔记本_y400联想笔记本网速慢
y400是联想笔记本电脑系列中的一款高性能机型,采用第三代英特尔酷睿i7处理器,标配NVIDIA GeForce GT 650M显卡,具有出色的图形处理能力,适合游戏、影音制作和工程设计等需求较高...
日期:05-31
瑞典快时尚品牌H&M天猫旗舰店恢复_瑞典快时尚集团
近日,瑞典快时尚品牌H&M天猫旗舰店恢复,消费者搜索全称“HM官方旗舰店”可获得旗舰店入口。华为mate40线上预购...
日期:08-17
追觅全品类产品亮相上海AWE2023,尖端科技引领未来行业风向标_追觅上海科技有限公司
2023 年 4 月 27 日至 4 月 30 日,全球知名科技公司——追觅科技,以“科技造梦,追觅不止”为主题,正式亮相在上海新国际展览中心举行的AWE2023(中国家电及消费电子博览会,简称AWE2...
日期:04-27
华为P50官方翻新机开售:3388元起「华为p50出厂价多少钱」
今天华为商城上架了华为P50的官翻机,目前有着3款颜色,提供8GB+128GB、8GB+256GB两种配置,售价分别为3388元和3788元,新机已在华为商城开售。目前同配置的华为P50全新机型售价为3...
日期:02-25
顺丰回应签收确认加一元钱?_顺丰快递回应“寄件选签收确认加一元钱”:系行业通行做法
  9 月 12 日消息 浙江省消保委近日发文,有消费者反映,在使用“顺丰速运 +”微信公众号寄快递时,发现顺丰公司提供了一项名称为“签收确认”的收费增值服务,收费金额为 1 元,...
日期:04-17
一汽大众官方回应中控屏弹窗:并非弹窗广告_一汽大众中控屏幕有哪些功能
9 月 28 日讯:据中国新闻网报道,针对导航弹窗一事,一汽大众回应称,车机消息推送是一汽大众面向车主的关怀行为,并非弹窗广告,提醒用户保养、品牌活动邀约等与用户息息相关的信息...
日期:10-02
“元宇宙”虚拟世界的营销法则_元宇宙 虚拟世界
声明:本文来自于微信公众号甲方财经(ID:jiafangcaijing2019),作者:甲方财经,授权转载发布。从2021年初元宇宙爆红以来,每天都会新增一个“元宇宙”,每五天会新增一个相关企业进场,...
日期:10-29
爱奇艺回应取消超前点播,为提供更好的会员体验主动做出当前选择
  10月4日,爱奇艺率先宣布取消超前点播,同时取消会员可见的内容宣传贴片。   爱奇艺对此表示,我们一直关注大家对超前点播的讨论和建议,我们坚信让用户满意才能实现长久发...
日期:07-17
不知道的世界作者「Redmi K60配置曝光:2000价位 最快明年2月发布」
昨晚,有数码博主曝光了关于Redmi K60系列手机的一些配置信息:Redmi K60系列将至少推出两款机型——Redmi K60、Redmi K60 Pro,全系均将搭载骁龙8+芯片,且有两种充电规格——标准...
日期:10-13
苹果提高多国iCloud存储价格 涨幅约25%「苹果icloud中国数据将留在国内」
苹果提高多国iCloud存储价格 涨幅约25%苹果公司已经在全球多个地区提高了iCloud存储的价格,包括英国、斯堪的纳维亚、东欧、中东和南美等地区。红米note2迷你手机网每个Apple...
日期:06-29