您的位置:首页 > 互联网

大模型时代的OCR,“CPU” 的味道更重了_dac模型

发布时间:2023-06-30 12:11:35  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),金磊 杨净 发自 凹非寺 ,授权转载发布。

经典技术OCR(光学字符识别),在大模型时代下要“变味”了。

怎么说?

我们都知道OCR这个技术在日常生活中已经普及开了,像各类文件、身份证、路标等识别,可以说统统都离不开它。

而随着近几年大模型的不断发展,OCR也迎来了它的“新生机”——

凭借自身可以将文本从图片、扫描文档或其他图像形式提取出来的看家本领,成为大语言模型的一个重要入口

在这个过程中,一个关键问题便是“好用才是硬道理”

过去人们会普遍认为,像OCR这种涉及图像预处理、字符分割、特征提取等步骤的技术,堆GPU肯定是首选嘛。

不过朋友,有没有想过成本和部署的问题?还有一些场景甚至连GPU资源都没得可用的问题?

这时又有朋友要说了,那CPU也不见得很好用啊。

不不不。

现在,大模型时代之下,CPU或许还真是OCR落地的一种新解法。

例如在医保AI业务中,在CPU的加持之下,医疗票据识别任务的响应延时指标,在原有基础上提升达25倍!

模型mod

iphone14和13

数据来源:英特尔合作伙伴

为什么会有如此大的转变?

一言蔽之,因为此前做OCR任务的时候,CPU的计算潜能并没有完全释放出来。

OCR,进入CPU时代

那么到底是谁家的CPU,能让经典OCR产生这般变化。

不卖关子。

它正是来自英特尔第四代至强®️可扩展处理器

据了解,第四代至强可扩展处理器增加了每个时钟周期的指令,每个插槽多达60个核心,支持8通道DDR5内存。

在内存宽带方面实现了50%的性能提升,并通过每PCIe5.0(80个通道)实现了2倍的PCIe带宽提升,整体可实现60%的代际性能提升。

但解锁如此能力的,可不仅仅是一颗CPU这么简单,是加成了英特尔软件层面上的优化;换言之,就是“软硬一体”后的结果。

而且这种打法也不是停留在PPT阶段,而是已经实际用起来的那种。

例如国内厂商用友便在自家OCR业务中采用了这种方案。

模型大厂

性能比较上,用友在第三/第四代英特尔®️至强®️可扩展处理器上进行了算法对比,推理性能提升达优化前的3.42倍:

dac模型

而在INT8量化后的性能更是提升到原来的7.3倍:

dac模型

值得一提的是,OCR的响应时间直接降低到了3秒以内,还是切换架构不影响业务,用户无感知的那种。

除了用友之外,像亚信科技在自家OCR-AIRPA方案中,也是采用了英特尔的这套打法。

大模型 ai

与用友类似的,亚信科技实现了从FP32到INT8/BF16的量化,从而在可接受的精度损失下,增加吞吐量并加速推理。

从结果上来看,相比传统人工方式,成本降到了1/5到1/9之间,而且效率还提升了5-10倍。

由此可见,释放了AI加速“洪荒之力”的CPU,在OCR任务上完全不亚于传统GPU的方案。

那么问题来了:

英特尔是如何释放CPU计算潜力的?

实际应用过程中,企业通常选择自己使用CPU来做OCR处理,但由于缺乏对CPU硬件加速和指令集的了解,就会发现CPU处理性能与理想峰值相差甚远,OCR程序也就没有得到很好的优化。

至于以往更常见的GPU解决方案,始终存在着成本和部署的难题。一来成本通常较高,且很多情况下,业务现场没有GPU资源可以使用。

但要知道OCR本身应用广泛、部署场景多样,比如公有云、私有云,以及边缘设备、终端设备上……而且随着大模型时代的到来,作为重要入口的OCR,更多潜在场景将被挖掘。

于是,一种性价比高、硬件适配性强的解决方案成为行业刚需。

既然如此,英特尔又是如何解决这一痛点的呢?

简单归结:第四代至强®️可扩展处理器及其内置的AI加速器,以及OpenVINO™️ 推理框架打辅助

当前影响AI应用性能的要素无非两个:算力和数据访问速度。第四代至强®️可扩展处理器的单颗CPU核数已经增长到最高60核。

而在数据访问速度上,各级缓存大小、内存通道数、内存访问速度等都有一定程度的优化,另外部分型号还集成了HBM高带宽内存技术。

大模型 ai

此外,在CPU指令集上也做了优化,内置了英特尔®️高级矩阵扩展(英特尔®️AMX)等硬件加速器,负责矩阵计算,加速深度学习工作负载。

这有点类似于GPU里的张量核心(Tensor Core)。

AMX由两部分组成,一部分是1kb大小的2D寄存器文件,另一部分是TMUL模块,用来执行矩阵乘法指令。

dac模型

它可同时支持INT8和BF16数据类型,且BF16相较于FP32计算性能更优。

有了AMX指令集加持,性能比矢量神经网络指令集VNNI提升达8倍。

腾讯音乐会员数

dac模型

除了核心硬件平台外,实际情况中帮助OCR在CPU上落地的,还有推理框架OpenVINO™️

市面上大部分AI框架都是同时支持训练和推理,OpenVINO™️则是删减了很多训练部分所需的冗余计算,主要支持推理部分。

而且也是专门针对英特尔硬件打造的优化框架。框架替换也不复杂,只需5行代码就可以完成原有框架的替换。

用户可以针对不同业务场景,来优化OpenVINO™️运行参数

比如用友OCR业务涉及文字检测和文字识别两个AI模型,优化方向有所不同。

前者对单次推理要求高,后者需要整个系统吞吐量的优化,那么OpenVINO™️分别采用单路同步模式和多路异步模式。单一模块优化后,再针对整体流程的优化。

这样一套软硬件组合拳打下来,英特尔充分释放了CPU计算潜力,在实际场景中也实现了与GPU同等性能。

不再是你以为的CPU

以往谈到AI加速、AI算力,大众经常想到的就是GPU,又或者是专用TPU。

至于通用架构芯片CPU,受到计算单元和内存带宽的限制,始终无法适应于计算数据庞大的深度学习。

但现在的CPU,已经不再是“你以为的你以为”了:

它可以深入到各个行业当中,轻松Hold住各种场景应用。

尤其在AMX加速引擎加持下,能将深度学习训练和推理性能提升高达10倍。

比如,媒体娱乐场景中,能帮助个性化内容推荐速度提升达6.3倍;零售行业里,能将视频分析速度提升高达至2.3倍,还有像工业缺陷检测、医疗服务也都能从容应对。

即便是在前沿探索领域,CPU也已经成为不容忽视的存在:

像是在生命科学和医药方向,在某些场景下的表现效果甚至比GPU还要好。

英特尔用CPU速刷AlphaFold2,结果力压AI专用加速芯片,去年发布的第三代至强®️可扩展处理器经过优化后就能使其端到端的通量足足提升到了原来的23.11倍。今年基于第四代至强®️可扩展处理器再次把性能提升到了上一代产品的3.02倍。

模型大厂

不过要实现CPU加速,背后也并非简单的硬件优化。

而是软硬件融合协同,从底层到应用的一整套技术创新,以及产业链上合作伙伴的支撑。

随着大模型时代的到来和深入,这种解决思路也正在成为共识。

像一些大模型玩家要实现大模型优化和迭代,并不能依靠以往单纯三驾马车来解决,而是需要从底层芯片到模型部署端到端的系统优化。

在算力加速层面的玩家,一方面摆脱不了摩尔定律的极限,另一方面要在应用场景中充分释放计算潜力,就需要与软件适配快速部署。

有意思的是,在最近OCR主题的《至强实战课》中,英特尔人工智能软件架构师桂晟曾这样形容英特尔的定位:

英特尔不仅仅是一个硬件公司,同时也拥有着庞大的软件团队。

在整个人工智能生态中,不论是从底层的计算库,到中间的各类组件,框架和中间件,再到上层的应用,服务和解决方案都有英特尔软件工程师的参与。

模型mod

CPU加速,不再是你以为的加速。英特尔,也不再是以往所认知中的硬件公司。

但如果你以为英特尔只有CPU来加速AI,那你又单纯了。

vivo手机s35

针对AI的专用加速芯片Habana®️Gaudi2®️即将迎来首秀;而通用加速芯片,同时兼顾科学计算和AI加速的英特尔®️数据中心GPU Max系列也刚刚结束了它在阿贡实验室Aurora系统中的部署,即将走近更多客户。

以这些多样化、异构的芯片为基石,英特尔也将形成更全面的硬件产品布局,并配之以跨异构平台、易用的软件工具组合(oneAPI)为整个应用链上的合作伙伴及客户提供应用创新的支持,为各行各业AI应用的开发、部署、优化和普及提供全方位支持。


返回网站首页

本文评论
学校+泛微OA系统,实现家校内外协同,档案数据一体化
  对大型教育集团而言,旗下有多所不同类型的学校,管理模式、收费标准不同,需要通过信息化手段帮助管理者解决各类管理难题。   为了规范学生管理、推动学校各部门协同管...
日期:07-16
叮咚买菜:国庆期间预制菜销量同比增长60%「叮咚买菜发展现状」
10月8日 消息:国庆期间,叮咚买菜平台迎来订单高峰。近几日,火锅、烧烤类预制菜销量增长迅猛。今年国庆,由于市民减少了远途出行,更多人会选择家庭聚餐、近郊出行、露营等休闲方...
日期:10-15
“2021年全球500强品牌 ”公布_2021年世界500强企业榜单
  (原标题:“2021 年全球 500 强品牌 ”公布:苹果时隔 5 年再次成为全球最有价值品牌)   1月28日消息 评估权威机构 Brand Finance 每年都会发布 “全球 500 强品牌”,今...
日期:04-07
ofo小黄车创始人戴威赴美创业:你的押金退了吗?「ofo小黄车ceo戴威」
快科技5月16日消息,据多家媒体披露,作为ofo小黄车创始人的戴威,在销声匿迹多年之后,已经开始再次创业,但跑去了美国,而且非常低调。据称,早在2022年2月,戴威就在纽约最悠闲社区之一...
日期:05-16
山东腾际物联网有限公司百科(山东亿腾物联网有限公司客服)
  山东腾际物联网有限公司是腾渊达集团旗下的子公司,是由中美多个成功创业者团队联合组建,以LoRa技术为核心,积淀8年无线技术,专业从事物联网(IOT)相关产品与系统平台的研究...
日期:02-03
ssd硬盘降价「SSD价格要崩盘了!闪存库存堆积如山 预期大跌35%」
SSD的价格很可能要失守了。redmi8跑分多少来自调研机构TrendForce(集邦咨询)的最新调查指出,进入第三季度下旬,结果旺季不旺,沉重的库存压力下,NAND Flash市场交易十分消极,合约价...
日期:09-07
男孩名字含“坤”被嘲笑抑郁自残 被起绰号“鸡哥”:网友吐槽太过分
3月23日,在四川成都,一名男孩因名字带坤”被起绰号鸡哥”。iPhone黄牛上海新能源车电费同学在课本上以及课桌上都写着鸡你太美”这些调侃的词语,产生抑郁厌学,自伤自残情绪。天...
日期:03-25
谦寻:2023年下半年将针对品牌方推出虚拟人创新业务_谦寻2020年gmv
4月23日消息,谦寻控股合伙人陶亚冬透露,“2023年下半年,针对消费者,谦寻将推出更多流量虚拟主播,满足IP粉丝购物需求;针对品牌方,谦寻也将推出虚拟人创新业务,协助品牌带货降本增效...
日期:04-23
7 月中国厂商应用出海收入排行:PUBG Mobile 第一,TikTok 入围
  8月7日消息 今日,App Annie 发布了 2020 年 7 月中国厂商应用出海收入 30 强。   报告指出,《PUBG Mobile》继续盘踞冠军宝座。FunPlus 的《State of Survival》挺入...
日期:07-15
为什么这届年轻人基本不走亲戚了? 网友:太八卦,徒增压力和负担
“为什么年轻人开始减少与亲戚的联系”于5月9日成为了微博热门话题,该话题阅读量达到1.6亿,讨论量超过1万,引发了广泛的社会讨论。南京大学社会学院副教授胡小武在2022年发表的...
日期:05-10
掏耳朵r姐「宁波女子掏耳朵16年竟掏出癌:为保命左耳被切除」
3月4日消息,据钱江晚报报道,宁波75岁的李阿姨被确诊为外耳道鳞癌,术前影像学检查提示病变已经累及腮腺和颈部淋巴结,为避免出现转移,切除了左耳。究其原因是李阿姨持续了16年的一...
日期:03-05
iPhone 14立减1230元 入手4769有赠品_5折iphone12
iPhone14在发售的一个多月期间,一直在降价,首发当天就跌了500元,而随着iPhone14不断地在降价,在目前双11已经走到了历史的最低价,现在立减1230元,已经比苹果官网优惠了太多,而且比...
日期:11-13
GPT风口下的数据标注员:人工智能背后的“老师”和AI局外人
数据标注员正在工作。受访者供图ChatGPT大火后,数据标注员迅速进入大众视野,也成了就业新风口。他们有的年薪百万,有的日结两百,但在ChatGPT风口上,作为人工智能背后“老师”的他...
日期:05-07
效仿苹果进军平板 各IT巨头雷声大雨点小
  5月18日消息,据国外媒体报道,苹果推出平板电脑iPad并取得巨大成功后,其他企业也摩拳擦掌,整装待发准备进入平板电脑,和苹果争夺这块新兴市场领域。   但这些潜在竞争企业...
日期:07-29
特斯拉新工厂选址已有眉目:马斯克在这个国家早有部署(特斯拉超级工厂选址)
全球电动汽车龙头特斯拉已开始游说加拿大安大略省政府,有意在该地区建立一个新的电动汽车工厂。腾讯微视鹅选日财联社8月9日讯(编辑 赵昊)综合多家外国科技媒体报道,全球电动汽...
日期:08-20
英特尔确认正开发“按需解锁”Sapphire Rapids处理器功能的机制_intel sapphire rapids
英特尔在他们的创新会议上确认,第四代至强可扩展"Sapphire Rapids"处理器将具有可选的"按需"激活模式,可以被理解为硬件内购。去年就已经传出英特尔准备为Linux提供"软件定义...
日期:09-30
虎牙第二季度营收22.8亿元 Non-GAAP净利润590万元「虎牙年营业额」
    讯 北京时间8月16日下午消息,虎牙直播(NYSE:HUYA)今日公布了截至6月30日的2022年第二季度财报。财报显示,虎牙第二季度总净营收为22.752亿元(约合3.397亿美元),而2021年同...
日期:09-26
戴尔1440笔记本内存条升级「戴尔1440笔记本」
戴尔 1440 笔记本是一款以高性价比为主打的笔记本电脑,它具有高性能、便携、易用等特点,深受广大用户的喜爱。下面将从外观、性能、屏幕、电池以及价格等方面,来详细介绍这款笔...
日期:05-31
荣耀magic2和小米8「荣耀Magic 5曝光:首批骁龙8 Gen 2 3000多元起售」
近日,又有荣耀新品的消息,荣耀即将在今年10月和11月发布新品手机,而年度旗舰依旧为荣耀Magic系列,新发布了荣耀Magic 4手机将搭载骁龙8 Gen2芯片,具体发布时间将在明年的3月左右,...
日期:10-17
更耐得住寂寞 澳大利亚首位女宇航员诞生:一大气物理博士「一位著名的宇航员」
11月26日消息,据媒体报道,澳大利亚航天局局长宣布称,经过数月的精心遴选,梅根娜克里斯蒂安(Meganne Christian)从22500 多名符合条件的申请者中脱颖而出,现成为澳大利亚有史以来第...
日期:11-27