您的位置:首页 > 互联网

预算扩至每日数百万美元 「苹果发力对话式AI」

发布时间:2023-09-11 04:46:19  来源:互联网     背景:

9月7日消息,据外媒援引知情人士透露,苹果始终在增加构建人工智能所需计算的预算,并且已经扩大到每天数百万美元。该公司的一个目标是开发一些功能,允许iPhone用户使用简单的语音命令来自动执行涉及多个步骤的任务。举例来说,这项技术可以让用户命令Siri语音助手用他们最近拍摄的五张照片创建GIF动图,并将其发送给朋友。如今,iPhone用户必须手动完成这个过程。

据了解该团队的人士称,早在四年前,苹果的人工智能主管约翰·詹南德里亚(John Giannandrea)就被授权组建团队,开发被称为大语言模型(LLM)的对话式人工智能(或称生成式人工智能)。当时,这项技术尚未成为软件行业的焦点。在OpenAI于去年推出聊天机器人ChatGPT之后,人们才发现苹果有先见之明。聊天机器人ChatGPT推动了大语言模型的繁荣。

几位苹果员工表示,尽管詹南德里亚多次表达了对由人工智能语言模型驱动的聊天机器人潜在用途的怀疑,但苹果并不是完全没有为语言模型的繁荣做好准备。这要归功于詹南德里亚,他帮助对苹果的软件研究文化做出了改变。

这些变化现在正获得回报,因为大语言模型的出现可能会改变人们创造一切东西的方式,从计算机程序到幻灯片演示再到书籍,都是如此。这项技术还有望自动化涉及文本的繁琐、重复性的任务,从摘要到处理企业IT票据或客户服务查询等。

这个名为“基础模型”(Foundational Models)的对话式人工智能团队,由几位曾在谷歌工作多年的工程师组成,詹南德里亚在加入苹果之前是他们的主管。该团队由庞若明(Ruoming Pang,音译)领导,他于2021年加入苹果,此前在谷歌工作了15年,包括詹南德里亚负责领导的人工智能研究部门。

苹果组建多个LLM团队

知情人士表示,“基础模型”团队的规模仍然很小,大约有16人,但用于培训苹果最先进模型的预算已经增加到每天数百万美元。相比之下,开发ChatGPT的初创企业OpenAI首席执行官萨姆·奥特曼(Sam Altman)曾表示,该公司在几个月的时间里,花费了超过1亿美元来培训GPT-4,这是该公司为聊天机器人提供支持的最先进软件。

苹果的“基础模型”团队扮演着与谷歌和Meta等公司人工智能团队类似的角色。在这些公司,研究人员需要构建人工智能模型,然后其他团队将这些模型应用到公司的各种产品中。

不过,苹果似乎至少还有另外两个相对较新的团队,正在开发语言或图像模型。苹果最近的一份人工智能研究报告和LinkedIn上的员工简介显示,该公司存在一个“视觉智能”(Visual Intelligence)团队,致力于开发能够生成“图像、视频或3D场景”的软件。

另一个团队正在进行涉及多模式人工智能的长期研究,这种模型可以识别和生成图像、视频或文本。这个多模式团队的领导者之一是乔恩·什伦斯(Jon Shlens),他曾在2021年底开始在苹果工作,之前在谷歌从事人工智能工作。什伦斯于今年早些时候加入了谷歌的人工智能团队(现在被称为Google DeepMind)。谷歌即将推出的Gemini模型具有多模式功能。

苹果“基础模型”团队已经开发出几个先进的模型,并正在内部测试。一位直接了解苹果聊天机器人开发情况的人士说,一款基于大语言模型的苹果聊天机器人最终可能会与使用苹果AppleCare客户互动。AppleCare是该公司提供保修和技术支持的售后服务。

Siri升级

另外,Siri团队也计划整合大语言模型,让苹果的智能语音助手用户以目前无法实现的方式自动完成某些复杂的任务,比如前面提到的用简单指令创建和发送GIF的例子。这项新功能与苹果的快捷方式应用Shortcuts有关,该应用允许用户使用不同的应用手动编程一系列操作,预计将于明年与新版iPhone操作系统一起发布。一位知情人士说,谷歌也一直在努力将其大语言模型与语音助手整合,以便能够理解和处理更复杂的任务。

据这位知情人士透露,苹果“基础模型”团队中的成员认为,其最先进的大语言模型AJAX GPT的功能超过了OpenAI的GPT 3.5,后者是支持ChatGPT最初版本的大语言模型。自那以后,OpenAI推出了一系列功能明显更强大的模型。

关于苹果如何在其产品中融入大语言模型,目前仍不清楚细节。据多位离职的苹果机器学习工程师说,该公司领导层更喜欢在设备上运行软件,这提高了隐私和性能,而不是在云服务器上运行。

但这可能很难实现。例如,据一位直接了解该模型的人士透露,AJAX GPT已经接受了2000多亿个参数的培训。参数反映了机器学习模型的大小和复杂性,参数数量越多,表示模型越复杂,需要更多的存储空间和计算能力。一个拥有2000多亿个参数的大语言模型,可能不适合在iPhone上运行。

缩小大语言模型的规模已经有先例可循。例如,谷歌的PaLM 2有四种尺寸,其中一种可以在设备上使用,另一种则可以离线使用。

苹果发言人拒绝就此置评。

谷歌的影响力

詹南德里亚被同事们称为J.G.,他最初加入苹果是为了帮助改进Siri,并为苹果的软件注入更多的机器学习功能。尽管他曾多次向同事们表示,对由大语言模型驱动的聊天机器人的潜在用途持怀疑态度,但一位知情人士表示,在过去一年里,在看到一些内部演示后,他开始承认这项技术有能力完成指定任务。

苹果“基础模型”团队的组建源于詹南德里亚的决定,他希望让苹果更像他的前雇主,让员工在进行各种研究和发表论文方面有更大的灵活性。此前,对这些做法的限制损害了苹果招聘人才的能力,尽管该公司成功地在其产品中使用了早期的人工智能技术。

2018年加入苹果后,詹南德雷亚帮助从谷歌招聘了关键工程师和研究人员。他还支持更多地使用谷歌的云服务,包括安装了谷歌开发的人工智能芯片(即张量处理单元)的服务器,用来训练苹果的机器学习模型,进而帮助改进Siri和提高其他产品功能。

据了解庞若明的人说,他在神经网络方面发表的研究成果吸引了大批追随者。神经网络是机器学习的一个子集,涉及训练软件识别数据中的模式和关系,类似于人类大脑的工作方式。庞若明某些比较著名的研究涉及神经网络如何与手机处理器协同工作,以及如何使用并行计算来训练神经网络,并行计算是将较大的问题分解成多个处理器可以同时计算的较小任务的过程。

开源运动

无线吸尘器哪个牌子好用,求推荐

庞若明对苹果的影响可以从AXLearn中看出来,这是他的团队在过去1年中开发用于培训AJAX GPT的内部软件。AXLearn是一个机器学习框架,可以快速训练机器学习模型。AXLearn的部分构成基于庞若明的研究,并针对谷歌张量处理单元进行了优化。

AXLearn是JAX的一个分支,JAX是谷歌研究人员开发的开源框架。如果将苹果的AJAX GPT比作一栋房子,那AXLearn就是蓝图,而JAX就是用来绘制蓝图的笔和纸。苹果用来培训大语言模型的数据主要源自建筑行业,目前尚未公开。

今年7月份,苹果“基础模型”团队悄悄地将AXLearn的代码上传到代码存储库GitHub,公众可以使用它来培训自己的大语言模型,而不必从头开始构建所有内容。苹果公开发布AXLearn代码的原因尚不清楚,但公司这样做通常是希望其他工程师能对模型进行改进。在詹南德雷亚到来之前,对于向来行事隐秘的苹果来说,开放可用于商业用途的源代码的决定显得不同寻常。

三大运营商宽带用户比例

团队领导

荷兰计算机科学家阿瑟·范·霍夫(Arthur Van Hoff)最初领导的团队,后来成为苹果“基础模型”团队的骨干。据熟悉霍夫的人说,他是上世纪90年代开发Java的太阳微系统公司团队的早期成员,后来成为了知名的企业家。霍夫于2019年加入苹果,最初致力于开发新版Siri,内部代号为黑鸟(Blackbird),但苹果最终放弃了这个版本。

然后,霍夫的团队开始专注于构建大语言模型,他们的目标是将其用于黑鸟的基本版本。该团队最初只有几名员工,其中最著名的是两名专门从事自然语言处理的英国研究人员汤姆·冈特(Tom Gunter)和托马斯·尼克森(Thomas Nickson)。这两位研究人员都在牛津大学获得了高等学位,并于2016年加入苹果从事Siri的研究。

据知情人士透露,2021年,庞若明加入苹果,帮助培训尖端的大语言模型。与其他苹果研究人员不同,他获得了留在纽约的特殊请求,并被授权在那里为公司的机器学习团队建立一个新的前哨基地。几个月后,苹果聘请了谷歌前人工智能高管达芙妮·梁(Daphne Luong)来监督霍夫的团队,并聘请谷歌研究员萨米·本吉奥(Samy Bengio)领导一个专注于长期机器学习研究的平行团队。

庞若明如今接管了“基础模型”团队,而霍夫则在今年早些时候开始无限期休假。据知情人士透露,庞若明团队的几名成员目前常驻纽约。

谷歌云交易

庞若明被招聘之际,苹果内部越来越意识到大语言模型在机器学习领域正变得越来越重要。据知情人士透露,OpenAI的GPT-3于2020年6月发布,这促使苹果机器学习团队要求获得更多资金来训练他们自己的模型。

据两名直接了解此事的人士透露,为了节省成本,苹果的管理人员历来鼓励机器学习工程师使用谷歌的云计算服务,而不是亚马逊的类似服务,因为谷歌的成本更低。

据一位熟悉相关讨论的离职苹果高管透露,谷歌高管过去曾对苹果表示,云服务定价较低,在一定程度上是对两家公司之间广泛商业合作的认可。根据协议,谷歌搜索是苹果Safari浏览器的默认搜索提供商。多年来,苹果始终是全球最大的云服务器租赁商,并已成为谷歌云的最大客户之一,尽管它仍然是亚马逊的重要客户。

一名知情人士表示,苹果还积极从谷歌和Meta的人工智能团队中招募人才。自从AXLearn代码于7月上传到GitHub上以来,已有18人对其进行了改进,其中至少有12人在过去两年内加入了苹果的机器学习团队。这些人中,有7人曾在谷歌或Meta工作过。


返回网站首页

本文评论
iphone128g升级到256g多少钱「苹果iPhone 14太能吸金 128G升级256GB赚走90%利润」
在智能手机行业,苹果是标杆性的存在,虽然全球销量干不过三星,只能位居第二,然而他们一家就能赚走整个行业大部分利润,吸金能力爆表,苹果对赚钱的算计几乎体现在每个细节上,比如升级...
日期:10-02
华为智慧屏S3 Pro开售 11999元支持240Hz鸿鹄画质_华为智慧屏s pro 评测
7月10日 消息:华为智慧屏S3Pro86英寸今日正式开售,价格为11999元。这款电视采用了一体成型金属机身设计,配备了4K旗舰芯片和AI视觉芯片,提供了4GB内存和64GB存储空间。华为智慧...
日期:07-10
完型品牌获千万美元天使轮投资,成为小米生态唯一贴⾝衣物品牌
  2021年8月,贴身内衣品牌“完型”确认,完型已完成⼩米科技领投,顺为资本、和⽟资本跟投的千万美元天使轮投资,同时完型成为⼩米⽣态链中唯⼀贴⾝衣物企业。完型品牌于2020年...
日期:07-17
再度蝉联!Informatica连续4年荣膺Gartner元数据管理领导者_Gartner 报告
  作为全球领先的IT研究和咨询公司Gartner于近日发布了《2019元数据管理解决方案魔力象限》报告,根据报告显示:Informatica再次处于领导者地位,且位于执行能力的最强位置和...
日期:11-11
JBL Tour Pro 2 真无线蓝牙耳机发布,充电盒带有显示屏_jbl蓝牙耳机充电盒给耳机充电用打开吗
IT之家 8 月 31 日消息,JBL 推出了一款独特的真无线蓝牙耳机新品 ——JBL Tour Pro 2,它的特别之处在于耳机盒上有一块显示屏。苏宁电商份额LPL女团JBL Tour Pro 2 号称配备了...
日期:09-05
智能手机厂商依赖人工智能和 5G 整合寻求新的增长机会「智能手机颠覆的行业」
4月12日消息:据 Canalys 报告,消费者需求不振是智能手机行业面临的最大挑战,导致全球智能手机出货量在 2022 年跌至 12 亿部以下。这一现象的原因包括宏观经济的影响和新款手...
日期:04-12
工业富联能上30吗「工业富联:已为客户开发并量产英伟达 H100 及 H800 等高性能 AI 服务器」
8月9日消息:富士康工业互联网股份有限公司(工业富联)日前披露 2023 年半年报,报告显示,工业富联上半年营业收入 2067.76 亿元,同比下降 8.21%;归属于上市股东的净利润 71.6 亿元,同...
日期:08-09
故宫、秦陵们的数字化突围战,需要腾讯这样的“资深绿叶”
  参观博物馆,正在成为一种新的生活方式,成为像吃饭、看电影、唱K一样流行的娱乐形式。   根据中国文化和旅游的统计数据显示,截至2018年末,全国共有各类文物机构10160个,...
日期:05-08
别让弹窗广告弹到安全底线_别让弹窗广告弹到安全底线怎么办
  来源:北京商报  弹窗广告常见,出现在喜剧场景中博君一笑,但弹到了汽车驾驶途中,把人吓出一身冷汗。小米对讲机连接普通对讲机  近日,“车载导航中控屏出现弹窗广告”的事...
日期:10-03
近10年来最多!50多头鲸在苏格兰海滩集体搁浅:部分被安乐死
7月18日消息,鲸鱼搁浅并不罕见,但多达50头集体搁浅就有点骇人听闻了。据英国《卫报》报道,超过50头领航鲸16日在该国苏格兰刘易斯岛海滩搁浅,当地一家救援组织前往对这些领航鲸...
日期:07-18
ai人工智能短视频网站「AI 是短视频平台的核心能力 快手其实是一家人工智能公司」
  如何将每位用户的注意力高效分配给海量丰富的短视频,而非集中在少数爆款之上,光靠人工运营的方法是不可行的,这必须通过人工智能技术来实现。  AI 如何赋能短视频平台? ...
日期:02-11
三大推手拉大节前市场缺口 网购考验快递业
  当前我国一年网购规模达到4500亿元,而一般从春节前两周开始,业务量就飙升至全年的峰值。这意味着,与春运几乎同步,互联网上也涌动着一股日益壮观的电子春运大潮。   然而...
日期:07-26
不及比亚迪三分之一 广汽丰田5月卖出7.7万台:竟然还涨了!「广汽丰田销量排行」
快科技6月3日消息,近日,广汽丰田公布了刚刚过去的5月份的销量成绩,共卖出77534台,甚至不到比亚迪的三分之一多(超24万台)。去年5月份,广汽丰田卖出了83800台,今年则同比下降了7%多一...
日期:06-03
今年发放游戏版号创6年来新低 精品化成游戏公司最佳选择「2017年游戏版号数量」
12月29日 消息:2022年的游戏版号已经发放完毕,数据显示,从2017年至2022年,游戏版号数量从9368个逐渐减少至512个,游戏市场门槛不断提升。业内人士介绍,今年版号减少,游戏行业普遍...
日期:12-29
b站申请牌子「B站申请AI相关商标」
8月10日 消息:企查查APP显示,近日,B站关联公司上海幻电信息科技有限公司申请注册“bilibiliAI”商标,国际分类为设计研究,当前商标状态为注册申请中。开心消消乐最后一关耳朵上...
日期:08-10
携程:元旦跨境机票预订量同比增长145%_「五一机票预订量已超2019年同期」
1月2日消息,携程发布2023元旦假期总结报告。报告显示,元旦跨境机票预订量同比增长145%,春运跨境游热度则更高,预订量同比增长超过260%。乘联会2019年汽车销量报告显示,相较2022年...
日期:01-02
工信部批准中国移动开展5G-ATG试验 采用4.9GHz频率
2023/5/5 17:58 工信部批准中国移动开展5G-ATG试验 采用4.9GHz频率   据工信部消息,为深入贯彻落实党的二十大关于加快建设网络强国的决策部署,推动我国航空互联网高质量...
日期:05-26
中国向埃及交付两颗卫星:我国的第一次!_中国给埃及建首都
6月25日,在位于埃及新开罗的埃及卫星总装集成测试中心(AITC),援埃及二号卫星项目初样星交付仪式举行,中埃双方项目经理现场签署初样星交付文件。来自中国驻埃及大使馆、埃及政府...
日期:06-27
小杨哥说事「疯狂小杨哥回应被打假:我只想做好自己 一切为你们服务」
11月16日 消息:近日,知名打假人王海称,疯狂小杨哥三只羊直播间售卖的金正破壁机和绞肉机均为虚标功率。玩游戏好的千元全面屏机对此,@疯狂小杨哥 在微博转发了金正生活电器发布...
日期:11-20
网游新规:未成年人平均每周仅可玩 3 小时网络游戏_未成年网络游戏时长
  据新华社消息,近日,国家新闻出版署下发《关于进一步严格管理 切实防止未成年人沉迷网络游戏的通知》,针对未成年人过度使用甚至沉迷网络游戏问题,进一步严格管理措施,坚决防...
日期:07-17