您的位置:首页 > 互联网

watsonx.ai 背后的黑科技——企业级的 AI 与数据平台

发布时间:2023-05-13 10:56:28  来源:互联网     背景:

我们站在人工智能(AI)革命的前沿。过去十年,数据与算力的碰撞催生了深度学习,让许多令人刮目相看的AI能力成为现实。然而,这也让我们面临好似潘多拉盒子那样的矛盾性挑战:自动化居然是劳动密集型的工作。听起来似乎好笑,但任何试图用AI来解决业务问题的人可能都知道,这是事实。 

传统的AI工具虽然功能强大,但可能昂贵且耗时难用。必须费力地收集、整理数据并使用特定任务的注释来标记数据,以训练 AI 模型;而构建模型还需要专门但却难找的技能,更不要说每个新任务都需要重复这个过程。因此,企业不得不将主要注意力放在自动化那些有丰富数据和高业务价值的任务之上,而把其它的一切先放在一边。然而,这种情况正在开始改变。

如需了解IBM技术、产品和服务的更多信息,点击访问IBM官网。

Transfomers算法架构和自监督学习方法的出现,使我们能够利用大量未标记的数据,为大型预训练模型铺平了道路,我们有时将其称为“基础模型”。这些大模型降低了自动化背后所需的成本和劳力。

基础模型为各种 AI 应用提供了强大而多样的基础。我们可以使用基础模型以有限的注释数据和最少的工作量快速执行任务;在某些情况下,我们只需要描述手头的任务就可以驱使模型去完成任务。

但这些强大的技术也给企业带来了新的风险和挑战。今天的许多模型都是在质量和来源未知的数据集上进行训练的,导致会产生攻击性、有偏见或与事实不符的响应。那些最大型的模型不仅成本高昂,而且训练和运行的耗能庞大,部署起来也很复杂。

IBM 一直在开发一种方法,解决企业使用基础模型所面临的核心挑战。IBM日前在Think大会上宣布推出 watsonx.ai,这是IBM提供的市场上最新的 AI 工具和技术门户。当然,这个领域发展极快,有些工具只有几周时间长,而IBM也在不断为市场提供更新的工具。 

watsonx.ai 是IBM刚刚宣布的watsonx产品集的一部分,包含的内容多样且将不断演进,但IBM总体的承诺不变——就是要提供安全的企业就绪的自动化产品。

这是 IBM 正在进行的一项工作,旨在加速客户从AI 新范式中获取价值的旅程。在此,介绍一下IBM构建一套由 IBM 训练的企业级基础模型的工作,包括IBM采用的数据与模型架构的方法。同时还将概述IBM新的平台和工具,如何帮助企业基于广泛的开源模型目录和IBM的模型,来构建和部署基于基础模型的解决方案。

数据:基础模型的基础

数据质量 至关重要。在有偏见或不良数据上训练的AI模型,自然会产生有偏见或不良的输出。这个问题在基础模型时代会变得更加复杂,用于训练模型的数据通常来自众多数据源,且异常丰富,以至于人类根本无法合理地梳理所有数据。

小米高层离职

由于数据是驱动基础模型的燃料,因此 IBM 一直专注于精心策划模型中的所有内容。我们开发了AI工具,严格过滤数据中存在的仇恨、亵渎、许可限制和偏见等。一旦发现,立即删除,然后重新训练模型,如此循环反复。

数据管理是一项永远都做不完的工作。我们不断开发和完善新方法,以提高数据质量和控制,以满足不断变化的法律和监管要求。我们构建了一个端到端框架来跟踪已经清洗过的原始数据、使用的方法,以及每个数据点接触过的模型。

我们不断收集高质量的数据,以帮助解决金融、法律、网络安全和可持续发展等各个领域的一些最为紧迫的业务挑战。 我们当前的目标是收集超过 1 TB 的精选文本用以训练我们的基础模型,同时添加精选软件代码、卫星数据以及 IT 网络事件的数据与日志。

IBM 研究院还在开发能够在基础模型整个生命周期中注入信任的技术,以减轻偏见并提高模型的安全性。例如FairIJ,它可以识别用于调整模型的数据中的偏差数据点,以便对其进行编辑。其它方法,如fairness reprogramming,允许我们减轻模型中的偏差,即使是已经训练过的模型。

专注于企业价值的高效基础模型

IBM 新的 watsonx.ai 开发平台提供了 一套旨在实现企业价值的基础模型。它们已被整合到一系列 IBM的产品当中,这些产品将在未来几个月内提供给 IBM 客户。

认识到并没有放之四海而皆准的解决方案,因此IBM正在构建一系列有着不同大小和体系结构的语言及代码的基础模型。每个模型家族都以一个地质名称代号——Granite (花岗岩)、砂岩 (Sandstone)、黑曜石 (Obsidian) 和板岩 (Slate)——它们汇集了来自 IBM 研究院和开放研究社区的尖端创新,每个模型都可以针对一系列企业任务进行定制。

最好的120Hz直屏

Granite 模型是基于仅解码器、类似 GPT 的架构,用于生成任务。 Saadstone模型使用编码器-解码器架构,非常适合对特定任务进行微调,可与 Google 流行的 T5 模型互换。 Obsidian 模型利用 IBM 研究院开发的新模块化架构,为各种任务提供高推理效率和性能水平。 Slate指的是一系列仅编码器(基于RoBERTa)的模型,虽然不是生成式的,但对于许多企业NLP任务来说既快速又有效。所有 watsonx.ai 模型都是在 IBM 精心策划的且聚焦企业的数据湖和IBM定制设计的云原生 AI 超级计算机 Vela 上进行训练。

效率和可持续性是 watsonx.ai 的核心设计原则。 IBM 研究院发明了用于高效模型训练的新技术,包括“LiGO”算法,该算法可回收小模型并让使其“长成”较大的模型。这种方法可以节省训练模型所需的 40% 到 70% 的时间、成本和碳排放量。为了提高推理速度,IBM研究院利用其在量化方面的深厚专业知识,或将模型从 32 点浮点算法缩小到更小的整数位格式。降低 AI 模型精度可以在不牺牲准确性的情况下带来巨大的效率优势。IBM希望很快在其AI优化芯片IBM AIU上运行这些压缩模型。

适用于基础模型的混合云工具

基础模型的最后一道难题是创建一个易用的软件平台来调整和部署模型。IBM 基于红帽OpenShift 构建的混合及云原生的推理堆栈,已针对训练和服务基础模型进行了优化。企业可以利用 OpenShift 的灵活性在任何地点(包括本地)运行模型。

IBM在 watsonx.ai 中创建了一套工具,为客户提供友好的用户界面和开发人员友好的库,用于构建基于基础模型的解决方案。我们的提示实验室 (Prompt Lab) 使用户只需几个标记的示例即可快速执行AI任务。调优开发平台基于IBM 研究院开发的最先进的高效微调技术,让客户可以用自己的数据来实现快速、可靠的模型定制。

除了 IBM 自己的模型之外,watsonx.ai 还提供了对广泛的开源模型目录的无缝访问,供企业进行试验和快速迭代。通过与Hugging Face建立的新合作伙伴关系,IBM将在 watsonx.ai 中提供数千个开源的Hugging Face基础模型,数据集和库。反过来,Hugging Face也将在 watsonx.ai 上提供IBM所有的专有和开放访问的模型与工具。 

可以 在此处了解有关该开发平台的更多信息。

展望未来

戴森v10和莱克m11

基础模型正在改变AI 的格局,并将加速推进已经取得的各项进展。IBM 很高兴能够立于这一快速发展的技术前沿并做出规划,把科技创新转化为真正的企业价值。

点击了解有关 watsonx.ai 的更多信息

如需了解IBM技术、产品和服务的更多信息,点击访问IBM官网

或扫描以下二维码进行访问:


返回网站首页

本文评论
上半年国产手机出货量下降超25% 年轻人不爱换手机了?_2018年1到2月国产品牌手机出货量同比约下降了
文/记者 温婧 ; ; ; ;近日有数据显示,今年上半年,国内市场手机总体出货量同比下降21.7%,国产手机出货量下降25.9%。还有数据显示,年轻人换机周期拉长至31个月。年轻人为什么不爱...
日期:08-17
腾讯进军电商_腾讯入伍电商成新兵 推超级电商平台
  继上周传出腾讯超级电商平台将在国庆后上线公测,首批将接入六家B2C网站的消息后,腾讯又于日前在其已曝光的QQ网购平台首页贴出推广公告,其中“全场免邮”、“货到付款”、...
日期:07-23
箱包趋势网「欧美疯抢中国箱包 订单已排到明年:爆发式增长」
国产箱包,在海外市场火了。小米智能摄像头ai据央视报道,统计数据显示,今年1-8月,我国箱包出口总额为1487.1亿元,同比增长30.6%。今年1-5月份,我国箱包出口额127亿美元,在全球市场的...
日期:10-18
节前两周网购爆棚 网上商城加薪倒休保配送
  网上置办年货是便宜,但赶上春节了,消费者能否准时放心拿到所需商品?每到节前,网购行业因物流环节问题而延误配送已成为消费者的“心理障碍”,在市商务委的推动下,北京市电子...
日期:07-25
剧毒蓝环章鱼与普通章鱼如何分辨?专家:肉眼就能看出「蓝环章鱼毒性有多强」
近日,有网友在火锅店吃饭时,看见菜品中一只章鱼很像蓝环章鱼,随后询问科普博主博物杂志”,该博主看后回复称,确为豹纹蛸(蓝环章鱼)。此事一出,立刻引发网友热议,据悉,蓝环章鱼会用河豚...
日期:01-17
google voice网络出现问题_Google Voice已经对移动运营商构成威胁
  Google正通过它的VoIP技术成为下一个移动运营商。不是将要,是已经发生。我们已经听到多少次有人说某个新技术敲响了电信运营商的丧钟了?让我们来看看这次又是什么技术。...
日期:07-25
欧拉闪电猫大定订单突破1.5万台_欧拉好猫闪电猫价格
10月31日晚,长城欧拉全新中型纯电轿跑车闪电猫正式上市,其共推出四款车型,售价区间为18.98-26.98万元,11月1日下午,欧拉汽车官方公布数据称,该车大定(支付2000元定金)订单量已经达到...
日期:11-09
河南文旅元宇宙创造者大赛数字场景组评选投票正式开启
由河南省文化和旅游厅主办,网易集团与河南省非物质文化遗产保护和智慧化中心承办的“行走河南•读懂中国”品牌推广暨元宇宙创造者大赛即日起正式进入评选阶段。据悉,本次大赛...
日期:12-26
外媒点评巴茨被炒:雅虎开始走向终结_雅虎ceo巴茨
  9月7日早间消息,雅虎CEO巴茨被解雇点燃了全球各大媒体的点评热情。财经和科技媒体纷纷第一时间发表感想,以下是部分媒体的点评摘要:   路透社:雅虎炒掉巴茨,结束她喧嚣的...
日期:07-22
美团两天蒸发4854亿「美团大跌后腾讯辟谣清仓,今年已遭沈南鹏8次减持」
  作者:陆涵之;;责编:宁佳彦  8月16日,有消息称,腾讯控股(00700.HK)将出售美团(03690.HK)股票,对此腾讯集团市场与公关部总经理张军进行了辟谣。今日港股,包括美团在内的腾讯系股...
日期:10-16
欠债4600万大叔直播卖烤肠还债:曾经是知名的餐饮巨头_负债4600万街头烤肠
在杭州延安路上的小吃街上,有一位白发大叔,一边卖烤香肠,一边做直播,生意挺红火。乍一看,大叔的日子应该很惬意,但事实上,他背着4600万元的债务,全靠卖烤肠还债呢。据悉,这位大叔名叫...
日期:11-19
华为mate 40涨价「华为Mate 40 5G手机立减2000 提前过双十一」
华为Mate 50已经开售了一个月,但仍然一货难求,从现在的市场来看华为Mate 40系列依然值得入手,华为Mate 40有麒麟芯+5G的配置,同样有着不错的性能表现,5G版本的华为Mate 40 Pro手...
日期:10-10
永辉2023年一季报:归母净利润7.04亿元,同比增长40.24%_永辉2021业绩
4月28日消息,永辉超市(601933.SH)发布2023年第一季度报告。财报显示,2023年第一季度,永辉实现营业收入达238.02亿元,环比2022年第四季度增长24.07%;归母净利润达7.04亿元,同比增长40...
日期:04-28
OPPO Reno8pro「OPPO Reno9 Pro+发布:骁龙8+配双芯人像摄影系统 售3999元起」
凤凰网科技讯(作者/莫环顺)11月24日消息,OPPO于今日举行发布会,发布手机OPPO Reno9系列,Reno9 Pro+搭载第一代骁龙8+移动平台的同时,支持双芯人像摄影系统,售价3999元起。OPPO Reno...
日期:11-25
猎豹移动业绩_猎豹移动三季度营收3.65亿元 游戏业务收入占比近半
11月24日 消息:今天,猎豹移动公布了第三季度财报。财报数据显示,第三季度,猎豹移动营收达3.651亿元,同比下降60.3%,归属于猎豹移动股东的净利润为2.59亿元,去年同期为4.515亿元人...
日期:08-01
腾讯幻核宣布停售数字藏品,内部人士:不涉及人员裁撤
记者/范佳来   深陷裁撤风波的腾讯数字藏品平台“幻核”宣布,将停止数字藏品发行。; 继谷歌后,亚马逊也将面临反垄断调查南宁市联通5g信号覆盖区域远鲸科技是做什么的公司...
日期:08-17
突发!唯一一款塑料壳iPhone将被苹果列入过时产品名单「塑料壳iPhone」
苹果计划在下个月将iPhone5c标记为过时的产品,根据MacRumors获得的一份备忘录。五一电车会降价吗苹果在2020年10月将iPhone5c标记为老式产品,这意味着该公司及其服务提供商只...
日期:10-09
快手电商“信任购”标签入驻选品中心「快手 信任电商」
2月13日 消息:今日,快手电商宣布“信任购”标签入驻选品中心。二手手机恢复出厂设置,数据还会被盗吗据悉,信任购是快手电商推出的首个服务IP,面向C端用户,提供商品维度和商家维...
日期:02-15
现代汽车 美国「现代汽车集团在美电动汽车销量累计突破10万大关」
2月13日消息,据外媒报道,行业数据显示,现代汽车集团在美国市场销售电动汽车8年后,累计销量突破了10万辆。谷歌pixel3能不能升级安卓12根据行业数据,截至今年1月底,现代汽车集团旗...
日期:02-15
2021中国新经济企业500强榜单发布 腾讯、阿里、字节位列前三「2021中国企业500强榜单出炉l」
  中国企业评价协会发布了“2021中国新经济企业500强”榜单,腾讯、阿里巴巴、字节跳动位列前三。  榜单显示,2021年新经济500强榜单,较上年变化率达到34.2%,超过三分之一的...
日期:10-24