您的位置:首页 > 互联网

Bert和Ernie_BERT和ERNIE谁更强?这里有一份4大场景的细致评测

发布时间:2019-08-20 16:48:03  来源:互联网     背景:

  BERT和ERNIE,NLP领域近来最受关注的2大模型究竟怎么样?刚刚有人实测比拼了一下,结果在中文语言环境下,结果令人意外又惊喜。具体详情究竟如何?不妨一起围观下这篇技术评测。

  1.  写在前面

  随着2018年ELMo、BERT等模型的发布,NLP领域终于进入了“大力出奇迹”的时代。采用大规模语料上进行无监督预训练的深层模型,在下游任务数据上微调一下,即可达到很好的效果。曾经需要反复调参、精心设计结构的任务,现在只需简单地使用更大的预训练数据、更深层的模型便可解决。

  随后在2019年上半年,百度的开源深度学习平台PaddlePaddle发布了知识增强的预训练模型ERNIE,ERNIE通过海量数据建模词、实体及实体关系。相较于BERT学习原始语言信号,ERNIE直接对先验语义知识单元进行建模,增强了模型语义表示能力。

  简单来说,百度ERNIE采用的Masked Language Model是一种带有先验知识Mask机制。可以在下图中看到,如果采用BERT随机mask,则根据后缀“龙江”即可轻易预测出“黑”字。引入了词、实体mask之后,“黑龙江”作为一个整体被mask掉了,因此模型不得不从更长距离的依赖(“冰雪文化名城”)中学习相关性。

bert ernie

 

  除此之外,百度ERNIE还引入了DLM(对话语言模型)任务,通过这种方式来学习相同回复对应的query之间的语义相似性。实验证明DLM的引入对LCQMC(文本相似度计算)系列任务带来了较大的帮助。最终ERNIE采用多源训练数据,利用高性能分布式深度学习平台PaddlePaddle完成预训练。

  2.  亲测

  到底百度ERNIE模型所引入训练机制有没有起到作用,只有实践了以后才知道。为此,我亲自跑了BERT和ERNIE两个模型,在下面的几个场景中得到了预测结果。

  2.1  完形填空

  完形填空任务与预训练时ERNIE引入的知识先验Mask LM任务十分相似。从下图的比较中我们可以看到,ERNIE对实体词的建模更加清晰,对实体名词的预测比BERT更准确。例如BERT答案“周家人”融合了相似词语“周润发”和“家人”结果不够清晰;“市关村”不是一个已知实体;“菜菜”的词边界是不完整的。ERNIE的答案则能够准确命中空缺实体。

Bert和Ernie

 

  2.2 NER ( 命名 识别 )

  在同样为token粒度的NER任务中,知识先验Mask LM也带来了显著的效果。对比MSRA-NER数据集上的F1 score表现,ERNIE与BERT分别为93.8%、92.6%。在PaddleNLP的LAC数据集上,ERNIE也取得了更好的成绩,测试集F1为92.0%,比BERT的结果90.3%提升了1.7%。分析二者在MSRA-NER测试数据中二者的预测结果。可以观察到:

  1.)ERNIE对实体理解更加准确:“汉白玉”不是实体类型分类错误;

  2.)ERNIE对实体边界的建模更加清晰:“美国法律所”词边界不完整,而“北大”、“清华”分别是两个机构。

  Case对比:摘自MSRA-NER数据测试集中的三段句子。B_LOC/I_LOC为地点实体的标签,B_ORG/L_ORG为机构实体的标签,O为无实体类别标签。下表分别展现了 ERNIE、BERT模型在每个字上的标注结果。

Bert和Ernie

 

ernie和bert区别

 

ernie和bert区别

 

  2.3  相似度

  ERNIE在训练中引入的DLM能有效地提升模型对文本相似度的建模能力。因此,我们比较文本相似度任务LCQMC数据集上二者的表现。从下表的预测结果可以看出,ERNIE学习到了中文复杂的语序变化。最终ERNIE与BERT在该任务数据的预测准确率为87.4%、87.0%.

bert and ernie

 

  2.4 

bert and ernie

 

  最后,比较应用最广泛的情感分类任务。经过预训练的ERNIE能够捕捉更加细微的语义区别,这些句子通常含有较委婉的表达方式。下面展示了PaddleNLP情感分类测试集上ERNIE与BERT的打分表现:在句式“不是很…”中含有转折关系,ERNIE能够很好理解这种关系,将结果预测为“消极”。在ChnSentiCorp情感分类测试集上finetune后ERNIE的预测准确率为95.4%,高于BERT的准确率(94.3%)。

  从以上数据我们可以看到,ERNIE在大部分任务上都有不俗的表现。尤其是在序列标注、完形填空等词粒度任务上,ERNIE的表现尤为突出,一点都不输给Google的BERT。


Bert和Ernie

小米11 ultra潜望式镜头

三星平板tabs2

三星手表上市


牛电科技 小牛电动

证券公司金融科技

小米眼镜探索版上市时间

三星S21 256G

天猫618家电大爆发,美的、海尔、格力跻身“亿元俱乐部”
高校“毕业大集”开市:“00后”学生热衷向毕业学长、学姐“淘宝”

oppo天玑900相当于骁龙多少


返回网站首页

本文评论
应用开发者借力百度制胜 赚超高人气更有稳定收益
  8月19日消息,以“开放”和“分享”为基因的互联网行业,正逐步告别单打独斗的时代。以百度为代表的各大IT巨头纷纷开放平台,吸引大小开发团队、开发者,共同构建平台、用户、...
日期:07-22
抖音电商盈利_以“新”之名,10个在抖音电商上的成长故事
  本文转载自公众号:数英DIGITALING(ID:digitaling) 作者:Ruonan   7月下旬,一部名为《向新力》的纪录片在抖音上线。   这是一部由抖音电商团队拍摄制作的系列纪录片,讲...
日期:09-08
《人工智能计算中心发展白皮书》:以“书”为鉴,洞见产业走向
  新一代人工智能(Artificial Intelligence,缩写为AI)是引领未来的战略性技术,正在与5G、大数据、物联网等领域深度融合,加速推动智能经济发展和产业数字化转型。我国高度...
日期:07-16
百度网盘1gb下载多久_百度网盘将推出青春版:不限下载速度,只有 10GB 存储空间
  11 月 19 日消息,11 月 17 日,在工业和信息化部信息通信发展司指导下,中国互联网协会、中国信息通信研究院组织百度网盘、腾讯微云、天翼云盘、和彩云、阿里云盘、迅雷云...
日期:07-17
网络动态表情包_网络动态
  自从4K投影仪问世以来,关于4K投影仪值不值得买、是否适合家用的争论就没断过!特地总结问题的主要矛盾点,主要来自于以下两点:1.既想用4K投影仪又不舍得花钱的心理;2.对...
日期:04-08
财报不及预期 周二Zoom股价大跌近17%_Zoom今日股价
查看最新行情 华为手环双十一活动  讯 北京时间8月24日凌晨消息,周二收盘,视频会议软件开发商Zoom股价大跌16.54%,报81.32美元,创2020年1月份以来收盘新...
日期:08-25
国庆假期新型职业火爆:宠托师帮喂猫日赚六百「上门喂猫工作」
因为庞大独居人群的需求,养猫成为很多年轻人的选择,有统计数据显示,2021年我国饲养犬猫的人群数量达到6844万人,其中近一半是90后”宠物主。长安马自达 合并随着养猫人群的壮大,...
日期:10-06
pico vr一体机怎么样「PICO 4 VR一体机新品发布:售价2499元起 将推VR版《三体》」
9月27日消息,PICO在中国市场正式发布新一代VR一体机——PICO 4系列,售价2499元起。这是PICO被字节跳动收购以来首次发布升级换代产品。据悉,PICO 4产品配置达到行业领先水平。...
日期:10-05
周鸿祎:数字化是一把双刃剑,数字化发展水平越高安全挑战就越大
运动鞋最后2个小孔  讯 9月2日晚间消息,在2022世界数字经济大会上,360集团创始人周鸿祎在演讲中称,数字化是一把双刃剑,数字化发展水平越高,安全挑战就越大。小米有品 茅台 预...
日期:09-04
寒武纪思元290发布即成“网红” 看看朋友圈都怎么说
  日前,国内AI芯片设计商寒武纪正式对外发布了思元290智能芯片产品,这款产品定位“训练”,采用开放加速模块OAM设计,具备64个MLU Core,1.23TB/s内存带宽以及全新MLU-Link™多...
日期:03-11
餐饮行业如何做好数字化转型,擎朗机器人用实力发言
  随着科技的进步与发展,大家出门就餐时会发现在不少餐厅内都有几款机器人在店内运行,经了解,这些都是来自上海擎朗智能科技有限公司的机器人,它们的出现也为餐厅的运营管理...
日期:03-01
B2B交易平台拍机堂为商家合作保驾护航_拍机堂公司地址
  万物新生团队成立于2009年,初创品牌爱回收于2011年5月上线,是中国最大的二手电子产品回收及环保处置平台,也是首家“互联网+环保”类型的循环经济企业。万物新生集团旗下4...
日期:12-12
SpaceX 新型底盘抵达星舰基地,最多可搭载 13 部引擎(spacex星舰最终目标)
  10 月 7 日消息,SpaceX 已经向位于得克萨斯州的星舰基地交付经过调整的推力结构件,这种新型火箭底盘让超级重型助推器能够搭载 33 部猛禽引擎。(单个底盘总共可安装 13...
日期:07-19
泰捷和当贝盒子怎么选,专业对比评测告诉你答案!_泰捷和当贝机顶盒哪个更好
  目前市面上比较好的高端电视盒子,除了外国高价高性能品牌英伟达、苹果等,国内现存在售的售价在4-5百元的电视盒子就是当贝,创维,泰捷这几家了,今天我们主要讲下泰捷we4...
日期:07-14
女神节首日 小米路由器拿下销售额第一:59元起(小米最新款路由器 上市)
  天猫38女神节首日,小米路由器荣获“路由器行业品牌销售额”第一。即日起至3月8日,小米路由器最高直降100元,全场低至59元起。   从榜单来看,3月5日,天猫路由器品牌销售额...
日期:04-23
美团等待医生开方「美团与三甲医院医生展开合作 提供24小时在线问诊、开药服务」
11月7日 消息:今日,美团官方公布数据称,为了积极响应健康中国行动要求,美团买药于2021年联合药店药企共同发起了“小黄灯”民生服务计划,在全国推广24小时药店。经过1年多的努力...
日期:11-13
革芯再造 传奇归来 ▎达尔优A970游戏鼠标全面登陆
  经典传承,全“芯”升级   破茧进击,传奇归来   北京时间2021年1月10日,达尔优(DAREU)发布A970游戏鼠标。搭载达尔优全新定制的电竞级AIM(AIM SENSOR)游戏引擎与第二...
日期:12-03
4S店保修期内拒绝维修,快手快说车帮消费者成功维权获好评
  汽车出现质量问题,消费者第一反应就是到4S店寻求帮助,希望得到专业人员的支持来解决问题。但最近,长安汽车车主陈先生遇到了烦心事,汽车在正常保修范围内出现车漆龟裂的问...
日期:04-22
iphone12 5699元「iPhone 14立减1230元 入手4769有赠品」
iPhone14在发售的一个多月期间,一直在降价,首发当天就跌了500元,而随着iPhone14不断地在降价,在目前双11已经走到了历史的最低价,现在立减1230元,已经比苹果官网优惠了太多,而且比...
日期:11-12
Google推出Android 13第二个测试版_Google发布Android 12
  5月14日消息(刘文轩)Google 在 I/O 大会期间推出了 Android 13 的第二个测试版,在操作系统、开发者资源与应用程序更新上的体验都进行了优化,并且在隐私权管理方面,推出...
日期:07-18