您的位置:首页 > 互联网

这,就是大模型时代的生产力

发布时间:2023-08-17 17:01:09  来源:互联网     背景:

声明:本文来自于微信公众号 机器之心(ID:almosthuman2014),作者:泽南,授权转载发布。

文心与飞桨,向我们展示了领先大模型的生产力。

大模型应用卷到了什么地步?几天前,我们看到的还是写文章、画图、回答数学问题,现在已经有人这么用了:

暗黑破坏神4公布新季度更新

图片

如果把一长段对话转发到别的群聊里,AI 可以自动生成总结。

图片

拿到数据后,直接进行有理有据还配图的分析。

图片

从市场分析、品牌构建、到输出视频广告,全部流程只需和 AI 进行简单对话就能完成。

这是刚刚结束的 WAVE SUMMIT 大会上,百度展示的文心大模型、飞桨平台、AI 原生应用如流等一系列技术、产品及生态成果。

最近一段时间,大语言模型取得了令人震撼的技术突破。以大语言模型为代表的人工智能正在深入千行百业,加速产业升级和经济增长。百度首席技术官、深度学习技术及应用国家工程研究中心主任王海峰表示,大语言模型具备了理解、生成、逻辑、记忆等人工智能的核心基础能力,为通用人工智能带来曙光。

王海峰进一步表示,人工智能具有多种典型能力,理解、生成、逻辑、记忆是其中的核心基础能力,这四项能力越强,越接近通用人工智能。

面对人工智能的这次重要变革,飞桨和文心大模型这两个百度核心技术拿出了一系列领先的发布。

文心大模型:遥遥领先

国内的 AI 领域中,百度一直走在技术的前沿,最早可以追溯到2019年3月发布的 ERNIE1.0。今年3月,百度又率先揭幕了自研知识增强大语言模型「文心一言」,其经过数万亿数据、千亿知识的训练,并采用了有监督精调、人类反馈的强化学习和提示等技术,具备知识增强、检索增强和对话增强等技术优势。

文心大模型的最新版本是前不久发布的3.5版。百度集团副总裁、深度学习技术及应用国家工程研究中心副主任吴甜表示,文心一言熟练掌握的创作体裁超过200种,涵盖了几乎所有写作需求,内容丰富度是初期的1.6倍、思维链长度是初期的2.1倍,知识点覆盖是初期的8.3倍。

新版本中,文心大模型进一步在基础模型、知识增强、检索增强等核心技术上进行创新,实现了基础模型、精调技术、知识点增强、逻辑推理、插件机制等方面的改进。

其中在知识和检索增强基础上,文心大模型3.5提出「知识点增强技术」,让模型能够更好地利用精细的知识点来提升理解生成能力,提升了对世界知识的掌握和运用。

推理方面,通过大规模逻辑数据构建、逻辑知识建模、多粒度语义知识组合以及符号神经网络技术,文心大模型提升了逻辑推理、数学计算及代码生成等任务上的表现。

能给我们带来更明显感知的是插件。我们知道,在实际应用时大模型有时会面临数据有限,能力不够专精的问题。在3.5版本上,文心大模型新增了插件机制,已上线的官方插件有百度搜索、览卷文档、一镜流影、说图解画、E 言易图。其中:

  • 百度搜索是默认插件,让文心一言具备了获得实时准确信息的能力。

  • 览卷文档借助文档智能模型及搜索系统可实现对文档的格式、布局等信息的充分理解及定位,突破了大模型对文档长度理解的限制。现在我们能利用文心与文档进行「对话」,解决针对文档的摘要、问答及创作的需求。

  • 一镜流影依托文心跨模态大模型,突破了不同模态之间语义对齐等技术难题,创新融合文本、视觉、语音、跨模态等一系列技术能力,用户仅需简单输入文字,即可在1分钟内获得完整视频。

  • 说图解画接入文心跨模态大模型,实现了图片理解的能力,不仅可以让 AI「看图说话」、还可深入理解图片氛围和情感。用户上传上传图片即可满足随拍发文、电商配文等图片配文需求,也以帮你激发灵感。

  • E 言易图则实现了将文字需求转化为可视化图表的需求。仅需简单的数据图表需求,或输入待生成图标的数据内容,即可生成可交互图表,协助用户完成数据分析、洞察及图表信息的交互演示。据了解,E 言易图已支持7类图表的生成,包括数据图、饼状图、折线图、雷达图、漏斗图、思维导图、散点图。

在现场,吴甜演示了文心一言应用插件的方式,在和 AI 对话的过程中,现在你已可以让大模型进行总结长文内容,图表展示数据,读取图像、生成文案,甚至还能合成带语音的视频。文心一言只花了5分钟,就完成了从行业调研、品牌分析选择到生成宣传视频,这样一个完整场景的工作。

插件进一步扩展了大模型的能力边界,对于文心大模型生态也至关重要。百度表示,文心一言还将上线更多优质官方和第三方插件,同时逐步开放插件生态,帮助开发者基于文心大模型打造 AI 原生应用。

为实现这一目标,百度依托于「文心一言」的核心技术,提供了插件开发工具集,可以支持信息服务类、工具类、以及基于大语言模型创新类等多类型的插件开发。开发完成后,还可以通过插件接入平台和应用层生态进行紧密结合。

插件能力正式启动邀测:yiyan.baidu.com/developer

与此同时,飞桨 AI Studio(星河社区)最新升级,正式推出星河大模型社区,在星河大模型社区,开发者可以获得一体化大模型开发体验。目前,星河大模型社区已积累超300个大模型创意应用,社区还提供了丰富的功能方便开发者进行交流。

会上,百度还最新发布了文心大模型「星河」共创计划,将以丰富的大模型资源、多层次的产业生态资源,携手广大开发者和生态伙伴们,激活数据资源价值,共建大模型插件,广泛创新 AI 应用。

飞桨开源框架 v2.5,拥抱大模型

文心大模型之所以能颠覆生产力,除了因为 AI 算法层面创新,也离不开深度学习框架的优化。

百度在人工智能领域是为数不多有全栈布局的公司,能力覆盖从芯片到应用。在框架层面上,飞桨深度学习平台向上支撑大模型生产,提高模型部署效率和灵活性,向下则适配各类硬件,提高硬件适配效率和降低成本。

今天的 WAVE SUMMIT 上,飞桨开源框架正式发布2.5版,完成了全面的架构升级,同时在大模型训练、推理和多硬件适配方面带来了新的功能。

其中的重点,就是与文心大模型做了联合优化。

戴森吹风机限量版

通过飞桨深度学习框架在大模型训练、推理、硬件适配等方面的一系列新技术,文心大模型的训练推理效率得到了大幅提升。现场给出一组数字:通过协同优化,文心大模型3.5的训练速度是优化前的3倍,推理速度更是快了30多倍。

其中在大模型训练方面,飞桨与文心在硬件集群上进行协同优化,提升了有效训练时间占比,芯片层面上进行了芯片、存储、网络协同优化,提升训练吞吐速度。

图片

而在软件上,飞桨与模型算法协同优化提高了模型收敛的效率。特别是在大模型训练中,优化的收敛效率和稳定性大幅度减少了训练时间,达到了事半功倍的效果。

很多科技公司都在对大模型的训练进行优化,而在推理上,我们面临着更大、更严峻的挑战。李彦宏曾表示:「当别人刚刚开始思考如何进行训练的时候,我们已经在推理上冲出了很远。」

在大模型推理方面,飞桨从模型压缩、推理引擎、服务部署三个关键环节,开展了全方位的协同优化。

图片

除了采取了自适应 Shift-SmoothQuant 压缩算法、结合场景的混合量化推理方案、动态插入批处理技术等,飞桨还持续结合算子融合加速、变长输入处理加速等方法,让文心大模型推理速度达到优化前的30多倍。

oppowatch2独立功能实用吗

为了更好的支撑大模型生产与应用,飞桨的大模型套件打通了整个流程,围绕大模型开发、训练、精调、压缩、推理、部署的六个阶段全流程进行了升级,降低了大模型开发和应用成本。

飞桨框架对于算大模型的优化,也离不开软硬件协同能力的不断提升。飞桨为文心大模型在各类硬件上的部署提供了统一方案,还推动建设了软硬件适配的国家标准。

此前,由中国电子技术标准化研究院牵头,百度、曙光、飞腾、浪潮一起联合起草了国家标准《人工智能 深度学习框架多硬件平台适配技术规范》。基于该标准,飞桨与30多家硬件厂商开展软硬协同深度优化,大大提升了软硬件适配的效率。

图片

在此之上,文心大模型与英伟达、寒武纪、华为等12家硬件伙伴开展了适配,覆盖了云和端侧多种硬件类型。目前已有25家硬件伙伴共建 AI Studio 硬件生态专区,为 AI Studio 大模型社区引入多元生态算力,支持开发者基于 AI Studio 的大模型开发及多样应用体验。

在基础层面上,飞桨也完成了重要升级。通过建设基础算子体系和组合算子机制,飞桨将神经网络编译器 CINN 更好地与主框架融合打通,借助其通用编译优化能力,实现了更加通用的性能优化。往上看,基础框架的自动微分也更加完善,实现了动静统一的高阶自动微分开发接口,可以更低成本实现高阶自动微分能力。

图片

马艳军表示,使用飞桨编译器,可以获得相比其他业内主流框架更好的性能。

基于飞桨框架的能力升级,特别是高阶自动微分能力,飞桨开源平台已发布赛桨 PaddleScience、螺旋桨 PaddleHelix、量桨 Paddle Quantum 等开源 AI for Science 工具,支持复杂外形障碍物绕流、结构应力应变分析、材料分子模拟等丰富领域算例,广泛支持 AI + 计算流体力学、生物计算、量子计算等前沿方向的科研和产业应用。

图片

经由基础框架的两大升级,飞桨全新的训练架构已初步成型,不仅保持了动静统一、一行代码动转静训练部署的优势,而且通过编译器技术进一步降低了模型性能优化的边际成本。

在解决了大模型开发和部署过程中的各类问题之后,飞桨平台现在做到了让 AI 模型的研发门槛更低、效果更好、流程更加标准化。

颠覆生产力

大会上,百度展现了大语言模型与智能工作的结合,重塑了人们工作的范式。

文心一言的能力已通过智能工作平台「如流」应用在百度内部的工作流程中。现场,百度集团副总裁、百度集团首席信息官李莹重磅发布如流「超级助理」。

它可以解决你工作中的大部分问题。在大会上,百度进行了一番演示。

文档处理是生产力工作的刚需,在大量文档中寻找和跳转经常会耗费很多时间。大模型出现后,你只需要给超级助理发出指令,它就可以立即找出相关文档。如果你需要了解新的知识,大模型可以生成详细的回答,如果你点击其中附带的参考链接发现是英文论文,也可以让大模型生成中文的摘要。

图片

据说,现在百度的很多员工都在用如流超级助理,AI 在很多小细节上可以成倍的提升效率。

说到提升效率,在科技公司里,如何能更好的写代码是很重要的事,李莹现场演示了基于文心大模型的编码工具 Comate X 智能编程助手,它目前支持30多种语言和10多种 IDE,甚至包括一些非常小众的语言,像汽车硬件的语言。

以代码生成为例,Comate 可根据自然语言的描述,生成对应的代码片段,也支持在代码编辑区内根据注释自动生成代码实现。在代码测试能力方面,Comate 可对选定代码生成单元测试用例,极大减少工程师编写单测用例的时间,提升代码质量。

开发基于 AI 原生的应用,不仅需要代码工具,还需要有开发套件。百度提出了 Comate Stack,其中包括三个工具:评测平台 iEValue、AI 应用开发平台 IPlayground 和数据集托管平台 iDateSet。

使用这套体系,开发一个休假政策插件,只需要两个步骤,规则也不用你输入,直接给 AI 喂文档就可以了。

图片

现在,大模型能力已成为百度员工的 AI 助手,Comate 帮助80% 百度工程师提升了编程效率,颠覆了程序开发的模式。而这种革命性的生产力,已经吸引到超过100家合作伙伴的兴趣。

面向全场景、覆盖多行业

文心大模型的应用实践,在国内覆盖了最大的产业规模。

这段时间,大模型发展的进程以天为计,论文技术层出不穷,应用也不断更新,百度在这场竞争里始终保持在前列 —— 不断更新版本的文心已应用到搜索、信息流、网盘、智能音箱等产品中,面向更多普通用户开放,面向企业的落地成果也非常可观。

文心大模型建立了一套完整的大模型体系,其中基础大模型包含 NLP(自然语言理解)、CV(计算机视觉)、跨模态大模型,任务大模型包含对话、搜索、信息抽取、生物计算等典型任务。

目前,文心大模型已拥有中国最大的产业落地规模,超过15万家企业申请了文心一言内测,其中超过300家生态伙伴在400多个具体场景取得了测试成效,覆盖办公提效、知识管理、智能客服、智能营销等领域。百度也联合国家电网、浦发银行、泰康、吉利等企业共同发布了11个行业大模型。

去年王海峰指出,深度学习平台加上大模型会贯通从硬件到场景应用的 AI 全产业链,进一步加速智能化升级。如今,百度的大模型 AI 技术栈已实现全面布局,深度学习加大模型技术让 AI 真正进入了工业大生产阶段。

与此同时,飞桨也公布了最新的生态数据:整个平台已汇聚800万开发者,服务了22万家企事业单位,基于飞桨创建的模型已有80万个。

人们都说这段时间 ChatGPT 引发的大模型浪潮带来了生产力变革,在大模型技术不断演进的同时,AI 的新能力终究还是要落地在各行业的实践中。

而百度在这个过程中,已经走在了前面。


返回网站首页

本文评论
宝马电动汽车排名前十名「宝马电车销量反超蔚来小鹏,到底谁在买?」
今日看点5min read宝马电车销量反超蔚来小鹏,到底谁在买?周永亮2023/06/30摘要吹响了老牌车厂反攻号角?在燃油车时代,BBA一直是豪华车市场的「门面担当」。但在新能源汽车时代,它...
日期:07-01
三人因违法制售《原神》外挂获刑,主犯被判四年_原神内鬼被罚50万
2021年6月,上海徐汇警方顺利破获一起制作并售卖《原神》游戏外挂的案件,抓获犯罪嫌疑人三名,涉案金额约200万元。近日,上海市徐汇区人民法院依法对该案件进行审理,判处被告三人有...
日期:07-31
苹果在中国产业链涉及多少人「苹果对中国依赖有多大? 8年只能移走10%的iPhone产能」
凤凰网科技讯 北京时间9月30日消息,尽管苹果公司比以往时候更早的在印度生产最新款iPhone,最大代工商富士康也投资3亿美元在越南扩建生产设施,但是苹果对中国的依赖度依旧很高...
日期:10-01
南京大学才女瞒着家里当主播 竟发现榜一大哥是自己爸爸「南京大学男神」
6月19日消息,昨天是父亲节,直播领域也出现了一件关于父爱的小插曲,非常应景。apple tv为啥不在中国发布据报道,南京大学才女鲁韦彤是新起步的小主播,直播间的榜一大哥不断与她积...
日期:06-19
美团旅游攻略大全「美团:3月以来,踏青赏花类景点门票订单量同比增长129%」
3月23日 消息:美团数据显示,自3月以来,踏青赏花类景点门票订单量同比增长129%。无锡、武汉、成都、广州、南宁等地“夜樱”搜索量位列全国前五。近一周,“夜樱”搜索量同比增长...
日期:03-24
超级网银尚不超级:银行被指创新乏力(超级网银是典型的)
  上线已逾百日的央行网上支付跨行清算系统,又称“超级网银”曾被寄予厚望,但事实上,“超级网银”目前看来还非常冷清。   专家指出,“超级网银”冷清现状的背后,是银行间利...
日期:07-25
腾讯郭凯天:将在前海新总部建造性科技馆 打造人类百年“科技树”
11月6日消息,今日,2022腾讯科学WE大会十周年如期举行。腾讯高级副总裁郭凯天现场宣布,腾讯正在深圳前海总部建造一座开放的永久科技馆,将联合顶尖科研机构,运用人工智能和全真互...
日期:11-08
NV一代神卡卷土重来!Steam新报告:RTX 40降价仍没存在感
快科技5月3日消息,Steam上给出了4月份的硬件调查报告,其中Windows 11系统的份额已经攀升至33%的历史新高。在2023年4月,Windows 11获得了10.98%。如此彻底的提升帮助操作系统达...
日期:05-03
今年双十一快递情况「怪不得大家不公布双11数据了 11月快递量出炉:大跌」
今年双11可以用凄凉来形容,一方面大家已经厌倦了抢券拼单的套路,另一方面互联网新人红利基本走到尽头,叠加疫情因素,结果可想而知。各大电商平台也心照不宣的没有公布双11详细战...
日期:12-22
芯睿科技新建千级超净车间开工日期「芯睿科技新建千级超净车间开工」
IT之家 12 月 17 日消息,据苏州纳米城发布,芯睿科技近期在苏州工业园区举行新建千级超净车间及办公室开工仪式。该项目占地面积约 4000m²,将用于大尺寸键合设备、激光键合设备...
日期:12-17
网飞要拍三体了「《三体》影视化,网飞能拍好吗?」
  [环球时报特约记者 吕克]备受关注的《三体》剧集(网飞版)24日发布首个幕后花絮。花絮中,制片人和主演纷纷现身,首季场景和人设曝光,为广大科幻迷揭开该剧神秘面纱的同时,也让...
日期:09-27
成为全球第一「全球首次!成功!」
王心艳 陈科 科技日报记者 谢开飞 叶青据中国东方电气集团2日消息,经中国工程院专家组现场考察后确认,由深圳大学、四川大学谢和平院士团队与该集团联合开展的,全球首次“海上...
日期:06-04
天玑9300曝光:下半年发布 跑分突破140万
在今天上午联发科天玑9300芯片的消息爆了出来。9块9抢苹果13的活动前不久联发科刚刚发布天玑9200 ,而天玑9300跟上一代天玑9200相比,天玑9300增加了3颗超大核和1颗大核,没有小...
日期:05-16
soul ceo 张璐_Soul创始人张璐携团队深挖元宇宙内涵 与Z世代共同探索社交新时代
2021 年是元宇宙元年,一时之间“元宇宙”三个字席卷了互联网的各个角落。而国内对于元宇宙的比较初探索也可以追溯到 2016 年上线的社交应用:Soul,其创始人张璐与团队在与年轻...
日期:08-17
山东将推动中小企业试点数字化转型_山东中小企业扶持政策
通信世界网消息(CWW)记者从山东省工业和信息化厅了解到,以制造业关键领域和产业链关键环节的中小企业为重点方向,山东将在全省范围内推荐遴选一批数字化转型需求迫切、发展潜力...
日期:08-14
天猫国潮瞄准智能锁领域,果加变身新国潮先锋
  近日,天猫国潮季活动“理想生活 锁见不同”智能锁展在杭州亲橙里开展,前来观展体验的年轻消费者络绎不绝,国潮魅力功不可破。在80、90甚至00后变身消费主力的当下,“以国为...
日期:07-01
戴耳机别超过一小时:严重可致外耳道发炎「戴耳机一小时休息多久」
快科技8月16日消息,现在机不离手成了大多数人的通病,出门忘带手机比忘穿衣服还没安全感。大多数人直接拿出手机,耳机一戴,沉浸在自己的独立时空。不过,有研究更是显示,戴耳机会令...
日期:08-16
诈骗网红梅尼耶的MCN游良文化被申请破产:小刚学长等多位网红受骗
据工商信息显示,近日,深圳市游良文化传媒有限公司新增破产审查案件,申请人为江某某,经办法院为深圳市福田区人民法院。小米新品发布会2020小爱公司成立于2022年2月,法定代表人为...
日期:04-08
腾讯三体网剧「腾讯和 Netflix 的《三体》 我谁都不看好」
  来源:爱范儿  难点在叙事视角  三体迷们,只要你愿意,全世界的屏幕都可以为你闪烁 —— Netflix 版《三体》第一季先行中文特辑正式放送!  据悉,Netflix 版《三体》由《...
日期:10-02
2014年智能手机等设备将占移动通讯流量的87%_由于通信网络的快速发展,中国智能手机用户数量近年来
  据市场研究公司ABI Research发表的一篇关于美国移动运营商网络通讯流量的报告称,智能手机和连接到网络的计算设备将是未来五年推动数据通讯流量增长的主要因素。到2014...
日期:07-29