您的位置:首页 > 智能设备

iphone如何快速转换声音「只需 15 分钟,iPhone 就能「复制」你的声音」

发布时间:2023-06-08 09:35:26  来源:互联网     背景:

  史蒂芬·霍金的「机械电音」,也许是世界上其中一个最有辨识度的声音。

  但那并不是霍金自己的声音。

  在霍金因渐冻症(ALS)失去说话能力的年代,技术还不足以让他能生成自己声音。事实上,能用上语音合成器的人都屈指可数。

  到了今天,ALS 患者虽然有了更多语音合成的选择,但总体费用和时间门槛仍然不低,普及度也有限。

  最近,苹果公布了全新无障碍功能 Personal Voice(暂未上线),不仅让用户能免费「备份」自己的声音,同时还在安全地应用 AI 技术上,作出了一次有意思的尝试。

  只需 15 分钟「调教」,就能生成你的声音

  ▲ 图自 Fastcompany

  在生成式 AI 可以模仿一切的时代里,用 AI 模仿一个人的声音听起来已经不算新奇,只是感觉有点安全隐患。

广汽新能源suv埃安y真实续航

  我好奇的,更多是苹果要怎样安全和高效地实现 Personal Voice 这一功能。

  据介绍,iPhone、iPad 和 Mac 用户只需要根据提示录制 15 分钟的音频,苹果就会基于设备端的机器学习技术来生成和用户一样的声音。

  相比之下,为失语群体提供专业语音合成服务的公司,可能需要采用专业设备,录制几小时的语音素材,价格最低都要数百美元。

  另一项新无障碍功能 Live Speech,则支持用户打电话、FaceTime 或者是和他人面对面对话的时候,输入文字即可生成语音内容,为失语或不方便说话的用户提供另一种「发声」方式。

  结合 Personal Voice 和 Live Speech 两项功能,失语用户就能用接近自己原本声音的生成声音和他人沟通。

  用起来是方便了,但怎样避免有人用网上扒的语音素材来生成他人的声音?

  素材随机化。

  在录制 15 分钟语音素材的过程中,苹果将随机生成需要用户朗读的内容,减少他人猜中素材的可能性。

  物理距离屏障。

  在录制过程中,用户需要在距离设备 6-10 英寸(约 15- 25 厘米)的特定空间里完成录制。

  在生成过程中,所有数据都将通过苹果的 Neural Engine(神经引擎)在设备本地完成,不必要上传到云处理。

  语音合成后,第三方应用如果想使用 Personal Voice,都要获得用户明确授权。

  即便第三方应用获得授权使用时,苹果也会采用额外的背景保护,确保第三方应用无法获取 Personal Voice 以及用户之前所录制的语音素材。

  如果是苹果「全家桶」用户,生成自己的 Personal Voice 后还能通过 iCloud 同步到不同设备上,并以端对端的方式加密。

  自己的声音,失去了才懂多重要

  人是感性的生物,而声音是很强烈的情感触发器。

  有研究指出,当人在听到母亲的声音时,身体释放出催产素水平和跟妈妈拥抱时产生的程度很相似。另一个研究则指出,听到自己的声音,会增强一个人的自我能动性。

  这听起来有点抽象。

  但当我们失去它时,重要性就变得显而易见了。

  2021 年 3 月,Ruth Brunton 被确诊 ALS。那年圣诞,她就已经失语了。

  ALS 患者中,约有 25% 的人患的是「延髓起病型」肌萎缩侧索硬化症,主要表现是说话障碍或吞咽困难。这类病人说话会逐渐变得含糊、带有鼻音,甚至失语。

  Brunton 的行动很果断,确诊后马上找公司去做语音生成。

  来回花了一个月时间,录了 3000 多个句子的语料,但最后出来的结果并不理想。

  那家公司用的是一种名为「单元选择(unit selection)」技术。

怎样让iphone只识别自己的声音

iphone怎么提取声音到本地

  简单粗暴来说,它就是通过「拼接」来实现语音生成,把语料拆分为大量小的语音单元,然后按需把元素拼起来。

  ▲单元选择技术下,「Bob」这一词语能被拆分成不同语音元素,图自《华盛顿邮报》

  这种技术生成的语音能听清,但会有点电音,听起来不太自然。

  结果就是,Brunton 录制的语料结合了微软一个名为「Heather」的声音,不但声音和自己毫不相似,甚至逼着这英国人「讲」起了美语口音。

  困在这个声音里,Brunton「只会在必要的时候说话,不再是因为想说话而说话」。

  从前和丈夫打闹聊天的心情消失了,Brunton 也不怎么愿意参加多人对话。

  即便是说「我爱你」,用一个不像自己的声音来说,意义也似乎被削弱了。

  六个月后, Brunton 和丈夫争取回了最初录制的语音素材,找了另一家公司,用 AI 技术合成了一个更像她自己的声音:

  这听起来也许有点傻,但重新获得自己的声音让我更有自信了。

  在波士顿儿童医院负责「增强沟通」项目的 John M. Costello 留意到,那些采用了更真实生成语音的病人,似乎更能够和亲近的人建立深厚的联结。

ipados 15.4.1有哪些新功能

  2022 年圣诞节,「重获新声」的 Brunton 还用语音录制的一段节日祝语。

  然而,圣诞刚过,Brunton 就染上了新冠,最后在今年 2 月离世了。

  她离开的那晚,丈夫 David 一整夜都握着她的手:

  我们有两年时间来告别。

  我们说好了,我们要说尽一切我们想说的。

  难以想象,如果 Brunton 后来没换上更像自己的声音,她又是否能自在地说出想说的一切。

  无障碍思维点亮灵感,AI 燃起生产力

  我一直认为,无障碍设计所挖掘的,其实就是人类多样性创造的想象力资源。

  我们去到和自己有着截然不同生活体验的人面前,聆听更少被诉说的故事和体验,创造出我们之前没想象过,但却能对更多人友好的的新生活方式。

  Personal Voice 能让失语的 ALS 患者重新获得自己的声音;也可以帮助在经历「刀片嗓」的我用自己的声音去和其他人对话;甚至,我也很难避免会去想象,是否应该用这为自己「备份」声音留给亲近的人,以免哪天自己会突然离世。

  而 AI 技术,就是实现这些想象力生产力。

  正如杜编辑之前说的,虽然不赶生成式 AI 的热闹,但苹果一直都把 AI 用来提升用户体验 —— 提升效率,保护隐私。

  提升效率,在于提升本地执行的机器学习算法和模型。

  除了 Personal Voice 以外,苹果这次预览的另一个无障碍功能 Point and Speak 也采用了本地设备端的机器学习技术。

  未来,视障用户在 iPhone 自带的放大器里,结合 Point and Speak 和旁白功能,就能凭自己手指把 iPhone 变成「点读机」—— 点到哪儿,让 iPhone 给你把文字读到哪儿。

  去年的「门检测」功能道理也类似,让设备端的机器学习帮视障用户识别出门,并朗读出门上面的信息和周围的标识。

  至于隐私,按乔布斯说的,就是 「如果你需要他们(用户)的数据,那就向他们(用户)请求。每一次都如此。」

  这在无障碍设计方面也尤其重要 —— 因为这些功能设计起源就是服务被所谓「常规设计」忽略的人,常常都是更弱势的群体,因此更有必要确保这些用户的隐私不受侵害。

  在这个语境下,我们也可开启更多关于数据应用权和透明度的讨论。

  苹果这次做 Personal Voice 时,和帮助 ALS 患者的非盈利机构 Team Gleason Foundation 合作。

  ▲ Team Gleason Foundation CEO Blair Casey(右)

iphone 怎么提取声音

  该机构的 CEO Blair Casey 一直也在推动语音生成公司设定一套标准录制素材设定,让用户能直接录这部分素材,并体验不同公司生成出来的语音效果,而不是像现在一样「盲赌」。

  同时,Casey 也主张语音生成公司把用户录制的语音素材数据提供给用户(因为很多用户可能录制后就失语了),以免他们未来想把这些数据用在其他技术上:

  如果更好的技术出来了,你会不想试一试吗?

  如果你没法拿回自己的语音素材,你就没法去试。

  AI 也许是我们时代最强的生产力。

  但是,这力该怎么使,也许以人为本的无障碍设计能给它不少指引。


返回网站首页

本文评论
反向虚标?AppleWatchUltra潜水能力比标称值更强「Apple Watch Ultra评测潜水」
对于不少老资历的用户来说,产品各种花里胡哨的虚标已经可以说是见怪不怪了,但“反向虚标”的,还确实不多。近日,有博主发现,苹果刚刚推出的Apple Watch Ultra就存在反向虚标的情...
日期:10-04
为什么苹果不能用普通的typec_为什么我国没有强制苹果用typeC口呢?
其实我国干过一件意义大得多的事情,所有手机的充电器必须用USB接口供电。这样一来所有手机的充电器都是可以互换的。这才是真环保。Type-C目前就是个笑话,线贵头松不兼容等。...
日期:12-17
谷歌pixel 7 跑分被曝_谷歌Pixel 7 Pro跑分曝光!自研芯片成了!
中关村在线消息:10月7日,据相关爆料,谷歌Pixel 7 Pro已成功发布,新机采用了Tensor G2处理器,性能表现十分卓越。GeekBench 5多核跑分为3149分,单核跑分为1068分,性能追平市面上的主...
日期:11-24
“会呼吸”的手机?三星Note系列将改变未来_三星note系列发展
  说起专利曝光,人们第一想到的也许是苹果,毕竟关注度高,其实除了苹果外,三星的专利也不得不让人重视。近日有消息称,三星公司获得了一项手机设计专利,在未来三星可能会发布一款...
日期:07-22
小米才是梦想!雷军37岁就财务自由了!「小米雷军50岁完成的十件事」
来源:中关村在线小米董事长雷军近日在《云顶对话》栏目中自爆了创立小米的原因:在带领金山完成IPO、自己半退休了三四年时间、在投资圈也算“风声水起”,37岁他财务自由,却想起...
日期:09-16
“游戏神器”腾讯全民WiFi预约抢购上线引爆市场_腾讯全民wifi怎么买
  8月11日,首款“游戏神器”——腾讯全民WiFi在京东商城正式开始预售,仅11日当天就有超过2万用户成功预约,火爆程度超预期。此前腾讯全民WiFi在 ChinaJoy展上首发亮相就引起...
日期:07-26
三星Note 8再曝设计图 后置指纹解锁是亮点_三星note8屏下指纹
  或许是传出三星GALAXY Note 8无缘屏幕下指纹识别功能的缘故,所以背面指纹解锁似乎成了该机更靠谱的解决方案。日前,国外爆料网站Slashleaks便放出了一组据称可能是三星GAL...
日期:07-22
马斯克spacex卫星布局图_美富豪明年搭乘SpaceX飞船上太空,正使用战斗机模拟训练
9月20日消息,美国亿万富翁贾里德·艾萨克曼(Jared Isaacman)已经与埃隆·马斯克(Elon Musk)旗下SpaceX展开合作,拟明年初开始执行“北极星计划”。现在,他的团队正使用战斗机模拟太...
日期:09-24
迎来反转?iPhone 15重新推出mini系列或为乌龙「iphone15pro发布时间」
此前,有消息表明,苹果可能会在今年的iPhone 15系列中重新引入mini产品线,但最近有业内人士认为这一消息或许并不准确,mini系列连续两代的低迷表现,不足以让苹果在新系列中重新推...
日期:01-04
提前激活惨遭罚款20万!iPhone14上手视频曝光!「苹果iphone 14发布为何突然提前」
来源:中关村在线魅族mx4pro发售价爱美客宏观分析iphone数据分析analytics中关村在线消息:9月14日,据相关爆料,全新的iPhone14系列新机已陆续地道各经销商,但不代表经销商可以开售...
日期:09-16
消息称Redmi K60系列最高支持120W快充,内置5500mAh电池「redmi k50pro与小米12x怎么选择」
  8 月 11 日,小米发布了 Redmi K50 至尊版手机。该机搭载高通骁龙 8+ Gen1 移动平台,起售价 2999 元。今日,有博主曝光了 Redmi 下一代旗舰手机 ——Redmi K60 系列新机的配...
日期:10-18
郭明錤iphone出货量「郭明錤:苹果 iPhone 14 的发布/发货日期可能早于 iPhone 13/12」
IT之家 8 月 18 日消息,彭博社 Mark Gurman 此前爆料,苹果公司计划在 9 月 7 日星期三(预计北京时间 9 月 8 日凌晨)举行首次秋季发布会活动,推出 iPhone 14 / Pro 系列和 Apple...
日期:09-28
苹果芯片为什么找台积电代工_苹果计划在美代工芯片,台积电美国工厂能如期量产吗?
【文/观察者网 李泽西】据“彭博社”16日报道,苹果首席执行官蒂姆·库克(Tim Cook)最近在内部会议中透露,计划从2024年起在美国亚利桑那州代工芯片,减少对中国台湾地区芯片的依赖...
日期:11-25
amd将发布锐龙7000_PC市场寒气逼人 AMD放大招:锐龙7000降价700元刺激市场
  再过一周,AMD的锐龙7000处理器就要上市了,相比2020年的锐龙5000系列,锐龙7000不仅升级5nm Zen4架构,性能大涨,同时价格竟然降低了。  旗舰锐龙9 7950X是16核32线程,频率4.5...
日期:09-23
5G巨头中兴发预告:2021年净利润大涨69%「中兴2020年利润」
1月28日晚,中兴通讯发表业绩预告,2021年内公司预计实现归属于上市公司普通股股东的净利润65-72亿元,同比增长52.6%-69.0%。归属于上市公司普通股股东的扣除非经常性损益的净利...
日期:07-31
惊鸿一瞥!总裁亲自透露一加11镜头设计 这次太用心了「一加11详细规格曝出」
【手机中国新闻】目前,虽然官方还未正式公布一加11系列新机的发布时间,但是从各方面的信息来看,这一时间点距离我们并不遥远。目前,一加官方也已经开始就11系列的发布而进行预热...
日期:12-22
苹果手机的备忘录扫描功能怎么用_苹果iPhone备忘录还有隐藏功能?可一键秒变扫描机
  一直以来,苹果手机在高端手机市场稳稳占据老大哥的地位,受到了诸多消费者的青睐。其最让人心动的是流畅简约的系统,而苹果系统自带的部分App,更是有着诸多妙用。但是,不少使...
日期:09-22
聊聊买笔记本电脑的“大忌”之一「买笔记本电脑应该注意些什么问题」
最近已经开学了,相信关注笔记本电脑的大学生会增加,针对这个需求,我们也如约制作了一期《开学季笔电选购指南》的视频:如果你想看这期视频,可以登录Bilibili.com搜索[笔吧评测室]...
日期:09-05
4599 元,华为 MateBook D 15 锐龙版今日预售:搭载 R5 5500U,支持超级终端功能
  2 月 27 日消息,华为 MateBook D 15 锐龙版现已上架天猫,搭载 R5 5500U 处理器,售价 4599 元,将于今日 20:00 开启预售,3 月 4 日正式开售。金彭ev电动汽车win11怎么从dev换b...
日期:07-14
乐视正式登陆香港  开辟海外市场第1站「怎么进入乐视官网」
  香港,2014年 8月 13日 – 内地一家最大的互联网电视业者 Letv乐视 (Letv)正式迈向国际、登陆香港、进军海外市场第1为隆重其事此标志性的里程碑,Letv 乐视 与和记电讯香港...
日期:07-26