您的位置:首页 > 互联网

生成式AI之战,谁能破局而出?「生成器模式实例」

发布时间:2023-04-21 02:17:53  来源:互联网     背景:

声明:本文来自于微信公众号 互联网那些事(ID:hlw0823),作者:小马哥,授权转载发布。

随着腾讯的入局,国内生成式AI大模型赛道集齐BAT三大巨头,竞争日趋白热化。

4月14日,腾讯云发布面向大模型训练的新一代高性能计算集群,搭载英伟达最新一代H800GPU,服务器互联带宽高达3.2T,算力性能较上一代提升3倍,号称目前国内性能最强的大模型计算集群。

除了算力基础设施,腾讯去年6月发布混元大模型,微信也在去年10月发布WeML大模型。在上月底的财报电话会议上,腾讯总裁刘炽平表示,对于腾讯整个业务来说,AI及大模型是一个增长的扩大器。

生成.a

在腾讯下场之前,百度、阿里和华为等公司已经先后落子这一领域。

3月中旬,百度推出“文心一言”;半个多月后,华为在一场行业峰会上披露了“盘古”大模型的研发及落地情况;4月11日,阿里大模型“通义千问”高调亮相,未来将接入阿里全线业务。

与此同时,360、网易、知乎、科大讯飞、昆仑万维等先后公布自己的大模型;此前淡出中心舞台的王慧文和王小川重出江湖,迅速敲定数千万美元的融资,正在四处招兵买马。

掀起新技术浪潮的AI大模型,已经成为科技公司必须参加的一场大考。在AI领域深耕多年的商汤科技,也在本月交出自己的答卷。

rtx3060和480显卡哪个强

入局AI大模型“马拉松”

4月10日,商汤公布以“大模型+大算力”推进AGI(通用人工智能)发展的战略布局,并发布“日日新SenseNova”大模型体系,涵盖自然语言处理、图片视频及3D内容生成、自动化数据标注、自定义模型训练等多种大模型及能力。

其中,最引人关注的是“商量SenseChat”,一款千亿级参数的自然语言处理大模型。在现场演示中,SenseChat能够结合上下文语境,流畅准确地回答各类问题,还具备超长文本理解能力,可以从复杂文档中提取和概括信息,帮助开发者编程,提供个性化的健康咨询等。

此外,商汤还展示了多款基于大模型体系的生成式AI模型及应用:“秒画SenseMirage”AI内容创作社区平台可以根据文本生成图片,拥有超10亿参数,支持二次元、三次元等多种生成风格,最高支持6K分辨率,还可支持自行上传数据集进行finetune、自训练等功能,定制训练属于自己风格的LoRA模型,显著降低模型的训练门槛;“如影SenseAvatar”AI数字人视频生成平台仅需一段5分钟的真人视频素材,即可生成数字人分身;“琼宇SenseSpace”和“格物SenseThings”3D内容生成平台能够生成大模型3D场景和精细3D物件,为搭建元宇宙虚拟空间提供高效、低成本的工具。

AI大模型是中国科技企业的又一块兵家必争之地。随着BAT等互联网公司,以及商汤、科大讯飞等AI老兵的入局,每个人都摩拳擦掌、跃跃欲试,准备大干一场。

特斯拉轿车颜色

业内人士普遍认为,国产大模型与GPT至少有2~3年的差距。怎样尽快赶上世界先进水平,是摆在大大小小玩家面前的命题。将这一命题拆解开来,最关键的是数据、算法和算力三大要素。

三要素中,算法的研发难度相对较低,且有众多开源项目可作为参考,中国公司最容易缩短甚至抹平差距;但在数据和算力方面,想要拉近与OpenAI的距离要困难得多。它需要更漫长的积累沉淀,也需要企业持之以恒地拿出真金白银,投入到AI相关的“硬科技”中。

这也意味着,大模型之争不是一场停留在应用层面的百米赛跑,而是一场由综合能力定胜负的马拉松。谁能在数据和算力上建立壁垒,谁就有望率先踏入生成式AI的新时代,在新技术浪潮中吃到更多红利。

数据和算力,AI大模型两大根基

ChatGPT之所以一鸣惊人、经受住了上亿用户不同场景下的考验,首先得益于OpenAI给它“投喂”了大量数据。

OpenAI此前披露,为了AI像人类那样流畅交谈,研发人员给GPT-3.5提供多达45TB的文本语料,相当于472万套中国“四大名著”。这些语料的来源包括维基百科、网络文章、书籍期刊等,甚至还将代码开源平台Github纳入其中。

丰富而庞大的语料库,让ChatGPT不仅能够聊天、讲故事,还会回答专业问题、帮学生写作业、给码农写代码。在一些读写测试中,ChatGPT展现出来的能力不亚于高中生。

与之类似,商汤语言大模型SenseChat也使用了大量数据进行训练,并充分考虑中文语境,能够更好地理解和处理中文文本。在发布会上,SenseChat一问一答应对自如,甚至还能够根据《专利法》答疑解惑,结合法条和最新资讯给出合理答案。

可以看出,足够多、足够丰富的数据,是生成式AI大模型的根基。商汤在这方面有自己的独特优势。

商汤的AI技术和产品已经在众多领域得到应用,在长期实践中,商汤积累了大量真实世界的高质量视觉数据,视觉信息可以转化为更多结构化的表达,形成丰富的多模态语料库,为大模型研发奠定基础。正如商汤董事长兼CEO徐立所言,“商汤积累了大量视觉类信息,这类信息作为知识,输入我们的多模态网络中,会带来完全不一样的数据基础。”不断增长的多模态数据池,让商汤从源头上建立了壁垒。

视觉大模型是商汤的核心技术突破点。早在2019年,商汤就发布了10亿参数的视觉大模型,2022年扩大至320亿参数,为迄今为止全球最大的视觉模型。而在自然语言处理、多模态和生成式AI大模型方面,商汤也已有产品落地。这些大模型的迭代生长和融合汇聚,最终造就了商汤SenseNova大模型体系。

除了海量数据,大算力是大模型的另一个根基。

AI大模型所需要的计算量,大致上相当于参数量与数据量的乘积。而大模型之所以“大”,就是因为参数众多和数据量庞大。过去5年,AI大模型的参数量几乎每年提升一个数量级,例如GPT-4参数量是GPT-3的16倍,达到1.6万亿个;而随着图像、音视频等多模态数据的引入,大模型的数据量也在飞速膨胀。

这意味着,想要玩转大模型,必须拥有大算力。OpenAI在生成式AI赛道上一骑绝尘,关键能力之一就是空前强大的算力底座。仅仅是为了跑出GPT-3.5模型,OpenAI就使用了约1万颗英伟达GPU来训练。

商汤很早就开始建设自己的算力底座。2018年前后,商汤就着手筹备大模型所需的算力、算法、数据等方面的工作;2022年1月,造价数十亿元的商汤人工智能计算中心(AIDC)交付使用,初始峰值算力达到3740Petaflops,已具备完整训练万亿参数规模的大模型的能力。再加上数据层和模型层,商汤AI大装置逐渐成型。

如今,商汤的AI大装置SenseCore,依靠2.7万块GPU,其算力达到5000Petaflops,可支持20个千亿参数超大模型同时训练,并提供涵盖数据、训练工具、推理部署、性能优化一条龙的大模型基础设施服务体系。

不过,AI大装置的效能如何,总算力并不是唯一指标。在日常应用中,AI大装置需要尽可能提高多卡并行状态下的算力利用率,尽可能保持长时间稳定运行。目前,SenseCore支持最大4000卡并行单任务训练,实现了多卡并行状态下的高算力利用率,还能持续7天以上不间断稳定训练。

此外,SenseCore提供了模块化、全链条的数据、训练及推理能力,可实现百亿级数据管理及检索、人工标注服务,一键量化、一键部署、一键应用,实现大模型快速上线验证。

自研自建的算力底座,为商汤在大模型领域施展手脚提供了舞台。

像SenseCore这样的AI大装置,其价值不仅体现在对于商汤现有大模型的支撑上,更指向未来发展。在源源不断的数据浇灌下,AI大装置能够以更高效、更经济的方式批量训练大模型,并缩短从研发到部署再到应用的链条,成为商汤大模型体系应用落地的推力引擎。

政策指引行业发展,AI大模型加速落地

目前,生成式AI大模型已经成为全球各国的关注焦点。作为下一代互联网的关键基础设施,中国科技行业正在积极自主研发大模型,而配套的监管政策也已在路上。

近日,国家网信办发布《生成式人工智能服务管理办法(征求意见稿)》。征求意见稿指出,国家支持人工智能算法、框架等基础技术的自主创新、推广应用、国际合作,鼓励优先采用安全可信的软件、工具、计算和数据资源。

同时,征求意见稿对于生成式AI产品及服务的提供者做出多项明确要求,包括遵守法律法规的要求,尊重社会公德、公序良俗等,为其发展路径指明方向、划定红线。

上述文件有望成为国内生成式AI产业的首份监管文件。它在释放鼓励发展的积极信号的同时,也设置了一系列监管规则,目标是促进生成式AI的健康发展和规范应用。

各领域企业正在积极拥抱生成式AI,利用新技术实现降本增效,并把AI能力输出给第三方企业,勾勒出充满想象空间的商业化图景。

以阿里为例,除了通义千问接入阿里的所有产品外,阿里云的AI能力和算力也已经在多个企业和机构落地,包括OPPO、南方电网、复旦大学等。此外,吉利汽车、智己汽车、奇瑞新能源、毫末智行、太古可口可乐、波司登、掌阅科技等多家企业表示,将与阿里云在大模型相关场景展开技术合作的探索和共创。

商汤最新发布的日日新SenseNova大模型体系,同样应用于诸多行业和场景,目前已落地20多个业务场景。

比如,智能汽车是商汤长期布局的赛道。2022年,商汤智能汽车板块量产交付数超50万辆,新增定点数超800万辆,覆盖30多家车企的80多款车型。如今,随着SenseNova大模型体系的推出,商汤正通过AI大模型进一步赋能自动驾驶和智能车舱的产品研发。

在本周的上海车展上,商汤展示了与SenseNova深入融合的绝影未来展示舱。在展示舱内,商量SenseChat可以与用户交流、推荐个性化内容,甚至自动提炼邮件信息,帮助节省阅读时间,如果是儿童上车后还会自动推荐进入儿童模式;而秒画SenseMirage能够为用户自动生成各种风格的照片,为出行增添乐趣。

借助大模型能力,商汤实现了BEV环视感知在国内首批量产落地,还首创自动驾驶GOP感知体系。此外,商汤绝影通过大模型进行自动化数据标注和产品检测,搭建的完整数据闭环体系,将模型迭代效率提升数百倍,目前已获得知名车企的定点。

此外,在生物制药领域,商汤与企业合作,利用AI大装置为蛋白质结构大模型提供AI推理算力,并为蛋白质相互作用模型,提供研发平台及训练算力,使得抗体筛选效率提升60%。

商汤以AI赋能实体经济的能力矩阵进一步扩充。SenseNova一方面服务商汤自身业务,另一方面,向政企客户开放了多种API(应用程序接口)。客户可根据自身需求调用SenseNova的各项AI技术能力,比如文本生成、图片生成、视觉感知、标注服务等,从而低门槛、低成本、高效率地实现各类AI应用。

基于商汤大装置和SenseNova大模型体系,商汤面向行业提供 “大模型即服务(Model-as-a-Service)”,涵盖自动化数据标注、自定义大模型训练、模型增量训练、模型推理部署、开发效率提升等多项能力。

富士x-h2新机

可以说,商汤已经实现了“技术-产品-应用”的商业化内外双循环。长期重注AI的商汤,正站在新一波技术革新的潮头之上继续前行。


返回网站首页

本文评论
世界十大汽车电池制造商「一张图看懂 | 2022年十大电动汽车电池制造商」
10月9日 消息:预计2019年至2028年间,全球电动汽车 (EV) 电池市场将从170亿美元增长到超过950亿美元。随着对交通运输行业减碳需求不断增加,为电动汽车提供电池的公司发展势头强...
日期:10-17
京东微电影《顶牛》全网上线,小年夜一起感受父子亲情背后的双向“热爱”
  2月4日,由京东打造的贺岁档父子亲情微电影《顶牛》在腾讯视频、爱奇艺、抖音、快手、今日头条、微博等平台全网热映。著名喜剧艺术家陈佩斯与其子青年喜剧人陈大愚倾情...
日期:07-16
美国总统奥巴马上任时间_美总统奥巴马计划于4月20日访问Facebook总部
  北京时间4月6日凌晨消息,Facebook周二宣布,美国总统巴拉克-奥巴马(Barack Obama)计划于4月20日在Facebook位于加利福尼亚州帕洛阿尔托(Palo Alto)的总部主持召开一次市政会议...
日期:07-27
港股美团收跌超9% 快手跌超4%_美团股票跌
查看最新行情   讯 8月16日下午消息,香港恒生指数收跌1.05%,恒生科技指数收跌2.03%。港股美团收跌超9%,盘中市值一度跌破万亿港元。此前有市场消息称,腾讯...
日期:08-21
微软不愿雅虎落入竞争对手手中 或被迫收购(微软为什么收购雅虎)
  据国外媒体报道,美国财经媒体CNNMoney周一发表分析文章称,虽然雅虎目前的状况非常糟糕,但是陷入困境的这家互联网公司正像是学校里的漂亮女生一样,引来了无数的追求。以下...
日期:07-24
瑞典快时尚集团_瑞典快时尚品牌H&M天猫旗舰店恢复
近日,瑞典快时尚品牌H&M天猫旗舰店恢复,消费者搜索全称“HM官方旗舰店”可获得旗舰店入口。618投影仪推荐华为荣耀7运行内存魅族mx5充电速度...
日期:08-20
苹果14款pro「非买不可!盘点 iPhone 14 系列十大升级亮点,Pro 版独占五大功能」
万众期待的新一代 iPhone 14 系列正式推出,不出所料苹果今年推出了 iPhone 14、iPhone 14 Plus、iPhone 14 Pro 和 iPhone 14 Pro Max 四款机型,没有了 5.4 英寸的 mini 机型,...
日期:09-13
小米13外观「小米13曝有10款颜色:卖到4500」
小米目前还没有官宣,但有消息称小米13将会在下周发布,而目前产业链公布了小米13手机的外观,配色高达10款,而且还都采用直屏的方案,而小米13Pro则延续上一代的曲面屏方案。我们先...
日期:12-03
迅雷:第二季度营收7830万美元 同比增长41.9%_迅雷 市值
  讯8月16日晚间消息,今日,迅雷公布了截至2022年6月30日第二季度未经审计的财报。据财报显示,迅雷第二季度总营收为7,830万美元,同比增长41.9%,符合预期收入指引。基于通用会计...
日期:10-27
郭明錤:苹果只有iPhone 15 Pro将通过USB-C升级支持更高速的数据传输
11月17日消息:知名分析师郭明錤今天在推特上表示,由于过渡到USB-C,明年计划推出的iPhone15Pro型号将支持更高的有线传输速度。虽然所有的iPhone15型号都将采用USB-C接口,而不是...
日期:11-19
观看复联4前,和飞利浦耳机一起重温漫威电影里的经典配乐_复联4 音乐
  4月24日,对于漫威影迷来说是有着深远意义的一天,《复仇者联盟4终局之战》在万众期待中上映,已经不单单是一场电影,而成为刷爆全网的娱乐事件。漫威电影宇宙的开启至今已有...
日期:06-04
当当售天梭表被指无授权 李国庆称没得到授权也是真货
  电子商务行业竞争激烈,促销大战接连不断,但人们对其售卖的货品来源渠道却并无所知。近日,天梭表官方微博对当当网的“父亲节”促销活动表态称,当当网销售的天梭表并未得到...
日期:07-30
kindle用笔「亚马逊发布新款Kindle 搭配手写笔售价339美元」
  讯 北京时间9月29日早间消息,据报道,亚马逊正在对Kindle阅读器进行新的改造。本周,亚马逊推出的又一款Kindle配备了手写笔,帮助用户记笔记。  当地时间周三,亚马逊在设备业...
日期:10-04
360防盗的官方网站_新年网购市场敲响警钟 360发布《防盗指南》
  “生活成本节约近三成,网购达人晒省钱经”。2010年以来,实惠又方便的网上购物成了发展最火的消费方式,然而大量黑客陷阱却为网购安全敲响了警钟。根据360安全中心的监测:今...
日期:07-25
在一起了!吉利汽车入股阿斯顿马丁:系英国超豪华性能品牌「吉利旗下英伦」
9月30日,浙江吉利控股集团在杭州宣布,已完成对英国超豪华性能品牌阿斯顿马丁拉贡达国际控股7.60%的股份收购。三星s6让未来现在就来吉利控股集团CEO李东辉表示:我们很高兴正式...
日期:10-04
瑞典快时尚品牌H&M天猫旗舰店恢复(瑞典快时尚品牌zara)
近日,瑞典快时尚品牌H&M天猫旗舰店恢复,消费者搜索全称“HM官方旗舰店”可获得旗舰店入口。apple watch如何语音报时iphone13pro摄像头变大口秀大会脱口秀大会微软Surface Pho...
日期:08-17
讲方言赢好礼,荣耀Play3携手快手将“爱”送回家
  2020年1月13日,在这个新春佳节到来之际,荣耀携手快手共同打造#爱的方言年终讲 活动,给大家的新年添福添彩。即日起至本月20号,参与者只要前往附近的荣耀门店,手持荣耀Play3...
日期:10-20
AMD Zen4霄龙全线泄露:96核心2.6倍无情碾压Intel_amd四代霄龙
先行登陆桌面市场后,AMD Zen4架构的下一站将是服务器和数据中心,代号Genoa,也就是霄龙9004系列,最多达96核心192线程。曝料大神MLIS现在公布了霄龙9004系列的完整型号、规格,甚至...
日期:10-20
上汽大通maxus纯电「彻底“玩转”车内空间,上汽大通MAXUS MIFA 9试驾体验」
当“电动、智能、舒适”成为MPV消费者选车关键词,全球多人出行领域,全尺寸纯电MPV的“风口”已经到来。需求决定市场,在国家开放二胎、鼓励三胎政策的刺激下,更大空间、高度舒适...
日期:09-18
facbook市值_分析称Facbook5估值百亿美元实为泡沫
  日前,老牌投行高盛抛出:Facebook估值高达500亿美元。尽管这个拥有十个零的百亿美元“天价”对于互联网领域来说并不骇人听闻,不过,对于一家成立仅6年,外界对其盈利模式仍捉...
日期:07-25