您的位置:首页 > 互联网

让聊天机器人完美回复--基于PaddlePaddle的语义匹配模型DAM

发布时间:2020-12-21 15:15:00  来源:互联网     背景:

  引言

  语义匹配是NLP的一项重要应用。无论是问答系统、对话系统还是智能客服,都可以认为是问题和回复之间的语义匹配问题。这些NLP的应用,通常以聊天机器人的形式呈现在人们面前,目标是通过对话的上下文信息,去匹配最佳的回复。因而,让聊天机器人完美回复问题,是语义匹配的关键目标。作为国内乃至国际上领先的NLP技术团队,百度在NLP领域积极创新、锐意进取,在聊天机器人的回复选择这个关键NLP任务上,提出了效果最优的深度注意力匹配神经网络DAM,并开源了基于PaddlePaddle的模型实现。本文对该模型的相关原理和应用加以介绍。

   DAM在PaddlePaddle项目的地址:https://github.com/PaddlePaddle/models/tree/develop/PaddleNLP/deep_attention_matching_net

  关键应用—聊天机器人多轮对话的回复选择

  基于检索的聊天机器人最重要的一项任务是从给定的候选回复中,选取与问题最匹配的回复。

  这一项研究的关键挑战是需要去捕获对话中不同粒度的语义依赖关系,如图1中的对话示例所示,对话的上下文和候选回复之间存在不同粒度上的两种关系:1)直接的文本相关,比如单词”packages”和”package”,或者短语”debian package manager”和”debian package manager”,他们之间直接有重叠的词汇。2)语段之间隐式相关关系,比如回复中的单词”it”指代的是上文中的”dpkg”,回复中的”its just reassurance”对应的是”what packages are installed on my system”。

  早期研究已经表明,在多轮对话中,从不同的语义粒度上捕获语段对之间的关系是选出最佳回复的关键所在。然而现有的模型更多的要么是考虑文本的相关关系,从而对于隐式相关的关系提取的还不够好,要么是使用RNN模型,在捕获多粒度语义表示上,开销又太大。面对这些挑战,百度NLP团队提出了DAM模型,用以解决多轮对话的语义匹配问题。

图1 多轮对话的示例

  DAM模型概览(Deep Attention Matching Network)

  DAM 是一个完全基于注意力机制的神经匹配网络。DAM的动机是为了在多轮对话中,捕获不同颗粒度的对话元素中的语义依赖,从而更好得在多轮对话的上下文语境中回复。

  DAM受启发于机器翻译的Transformer模型,将Transformer关键的注意力机制从两个方面进行拓展,并将其引入到一个统一的网络之中。

   自注意力机制(self-attention)

  从单词级的嵌入中堆叠注意力机制,逐渐捕获不同粒度的语义表示。比如对一个句子使用注意力机制,可以捕获句子内部词级别的依赖关系。这些多粒度的语义表示有助于探索上下文和回复的语义依赖关系。

   互注意力机制(cross-attention)

  在上下文和回复之间应用注意力机制,可以捕获不同语段对之间隐式的依赖关系,从而为文本关系提供更多的补充信息从而为多轮对话选择更好的回复。

  在实践中,DAM将上下文和回复中的每句话的每一个单词当做一个语段的中心语义对待,通过堆叠注意力机制,从不同级别上丰富其语义表示,进而围绕该中心单词,生成更多高级的语段的语义表示。这样上下文和回复中的每句话都是在考虑了文本相关和依赖关系的情况下,且基于不同粒度进行匹配的。DAM首先捕获从词级到句级的上下文和回复之间的匹配信息,然后通过卷积和最大池化操作提取最匹配的特征,最后通过单层的感知网络得到一个匹配得分。

      DAM技术详解

图2 DAM模型网络结构

  DAM模型的网络结构如图2所示。它包括表示-匹配-聚合三个主要部分,输入是对话的数据集,由上下文的文本每一句话u和回复r所对应的词嵌入组成,输出是得到一个对话中上下文与回复之间的匹配分数。

  表示模块能够对输入的上下文u和回复r构建不同粒度的语义表示。通过堆叠多层相同的自注意力模块,将输入的语义词嵌入构建为更加高级的语义表示。得到语义表示之后,上下文与回复以语段-语段相似矩阵的形式互相匹配。匹配有两种,自注意力匹配和互注意力匹配,分别可以衡量上下文与回复之间的文本关系和依赖关系。这些匹配的分数会形成一个3D的匹配图Q,它的维度分别代表上下文中的每一句话、每句话中的每个单词以及回复中的每个单词。接着,语段对之间的匹配信息通过卷积和最大池化提取,进一步得通过单层感知网络聚合,得到匹配的分数,代表候选回复与上下文之间的匹配程度。

图3 注意力模块

  DAM网络中使用了注意力模块实现自注意力和互注意力机制,它的结构如图3所示。该结构借鉴了Transformer模型中的注意力机制的实现。它的输入有三个部分,query语句、key语句和value语句,分别以Q、K和V表示。注意力模块会首先对query语句和key语句的每个单词进行标量点积注意力(Scaled Dot Product Attention)计算,具体计算如公式(1)和(2)所示。算出的Vatt存储了语义信息,代表了query语句和value语句之间的相互关系。Vatt与query语句输入会相加一起,组成了一个能够代表它们联合含义的语义表示。然后通过一层标准化(Normalization)的操作,可以避免梯度消失或者爆炸。再接着,使用Relu激活函数的前馈神经网络FFN进一步处理聚合的词嵌入,操作如公式(3)所示。

  公式(3)中,x代表的是一个与query语句一样形状的2Dtensor,W1,W2,b1和b2都是要学习的参数。最后的输出还会经过一次标准化操作,从而得到最后的结果。整个注意力模块的结果由公式(4)表示。

  整个注意力模块可以捕获query语句和key语句的依赖关系,利用依赖信息可以得到语义表示,再进一步的构建多粒度的语义表示。

  公式(5)和(6)就是利用了注意力模块,得到了上下文和回复的多粒度语义表示信息。公式(7)得到了自注意力的匹配矩阵。公式(8)和(9)通过注意力模块得到上下文与回复之间的语义表示信息,进一步的组成互注意力的匹配矩阵。

  自注意力矩阵和互注意力矩阵聚合成了一个3D匹配图Q。再通过带最大池化的3D卷积,得到匹配特征,最后通过单层感知层进行匹配分数的计算。

  DAM模型在Ubuntu和豆瓣对话两个语料库上测试了多轮对话任务,如表1所示,相比其他模型获得了最优的效果。

  Ubuntu语料库是英文的关于Ubuntu系统troubleshooting的多轮对话数据。它的训练集包括50万个多轮对话的上下文文本,每个对话文本带有1个人类积极回答的正例回复和1个随机采样的负例回复。它的验证集和测试集各自包括5万个上下文文本,每个上下文文本各有1个正例回复和9个负例回复。豆瓣对话语料库是中文的关于一些开放领域的对话数据集。它的验证集包括5万个对话实例,每个实例各有1个正例和负例回复,测试集有1万个实例,每个实例有10个候选回复。

表1:DAM模型的效果对比

  DAM模型PaddlePaddle实战

  环境准备:首先根据项目文档要求,下载最新版本的PaddlePaddle。Python的版本要求>=2.7.3

  项目的代码目录及简要说明如下:

让聊天机器人完美回复--基于PaddlePaddle的语义匹配模型DAM

  下载项目以后,接下来以Ubuntu语料库应用为例:

  进入ubuntu目录

  cd ubuntu

  下载预处理好的数据用于训练。项目提供了下载数据的脚本

  sh download_data.sh

  执行训练和评估的脚本

  sh train.sh

  使用如下脚本,可以了解更多关于arguments的使用说明。

  python ../train_and_evaluate.py --help

  默认情况下,训练是在单个的GPU上执行的,用户也可以转到多GPU模式运行。只需要将train.sh脚本中的可见设备重置一下即可。比如

  export CUDA_VISIBLE_DEVICES=0,1,2,3

  执行测试脚本

  sh test.sh

  类似的,用户可以很容易的利用Douban对话语料库进行实验。

  传送门:

  PaddlePaddle Github项目地址:

  https://github.com/PaddlePaddle

  DAM模型项目地址:https://github.com/PaddlePaddle/models/tree/develop/fluid/PaddleNLP/deep_attention_matching_net


facebook创始人扎克伯格故事

返回网站首页

扩展安全更新esu


特斯拉model y超长续航

亚信科技年会

全新的数据填报,更强的BI分析,Wyn Enterprise V3.0 Update2 发布
创维3月出货量再创第一,408全球电视节掀起焕新热潮

redmi note10电池容量


返回网站首页

本文评论
腾讯股票 知乎「腾讯概念股震荡走高,知乎涨15%」
  10月5日上午,腾讯概念股震荡走高,知乎涨15%,名创优品涨超10%,阅文集团涨超8%,腾讯音乐涨超7%。apple watch series 7各版本区别英伟达2022新显卡发布智能手表诞生以来,在这个...
日期:10-05
美国科技股创下疫情以来连续两周最差表现:亚马逊上周跌幅接近8%
  讯 北京时间9月26日早间消息,据报道,对科技行业投资者来说,今年第三季度的股市反弹已成为泡影。过去两周,纳斯达克综合指数分别下跌5.5%和5.1%,创下自2020年3月美国新冠疫情...
日期:09-26
玖云平台推出招聘行业通信解决方案——虚拟小号
  近年来,随着互联网普及率的上升,我国互联网招聘市场迎来了快速的发展。“互联网+”风潮席卷,移动互联网为整个招聘行业注入了新的活力,招聘行业快速发展,跳槽求职变成...
日期:04-02
雅虎和阿里巴巴的谈判_传阿里正与淡马锡洽谈购买40%雅虎股份
  10月12日消息,近日据国外媒体报道,知情人士透露,阿里巴巴集团正与新加坡淡马锡控股公司洽谈购买其手中40%的雅虎股份。   “我们对雅虎很感兴趣。”马云的一句公开表态,...
日期:07-23
冲刺“麻辣烫股”,杨国福做着高端梦「杨国福麻辣烫ppt」
文章目录 01、麻辣烫界的蜜雪冰城,想做星巴克 02、麻辣烫真能吃出“荣耀感”? 03、成为“麻辣烫第一股”,然后呢? 声明:本文来自微信公众号“伯虎财经”(ID:bohuFN),作者:伯虎团队...
日期:11-03
苹果 AirPods Pro 2 耳机盒 CAD 渲染图曝光「AirPods Pro图」
IT之家 9 月 4 日消息,根据 AppleInsider 的 Andrew O'Hara 在 Twitter 上分享的 CAD 渲染图,即将推出的第二代 AirPods Pro 的新充电盒可能具有扬声器孔、麦克风和挂绳开孔。...
日期:09-06
微软7月起Azure云平台入库数据传输实现免费(azure部署)
(小贝)北京时间6月23日消息,据国外媒体报道,微软日前宣布,从今年7月1日起,Azure云服务平台的所有入库数据传输都将实现免费。微软通过博客宣布,无论是“高峰时段”还是“非高峰时...
日期:07-30
联发科g72相当于「搭载联发科芯片 摩托罗拉新品G72详细规格曝光」
近日,有网友曝光了摩托罗拉旗下即将发布的新品手机G72的渲染图,从渲染图中不难发现,该机外观多少有些X30 Pro的影子。爆料人称摩托罗拉G72将搭载联发科Helio G99芯片,采用一块OL...
日期:09-30
当之无愧的明星店长!苏宁员工“组合拳式”营销方法走红
  近日,苏宁红孩子济宁店一员工想出“组合拳式”营销方法走红网络,鉴于疫情期间的特殊情况,通过直播、社群、小程序、推客等多种营销方式带动门店业绩,服务母婴群体,不仅超额...
日期:12-28
Meta宣布元宇宙软件的一位重要高管将离开公司_meta元信息
Meta发言人于当地时间周五表示,公司Horizon社交媒体虚拟现实软件部门副总裁Vivek Sharma将离职。据悉,Sharma在过去六年时间里一直在Facebook母公司Meta工作并在市场和游戏部...
日期:09-04
中国第一家b2c企业_2010年中国B2C企业融资额超过10亿美元
  2010年中国B2C企业融资额超过10亿美元。而今年的融资金额将再创新高,市场竞争将更加激烈。但是这几年,一些B2C前辈企业已经笼络了大批的忠实用户,其黏度之高让后起的B2C商...
日期:07-26
拼多多公布年货节数据:百亿补贴下,苹果/华为/小米分列智能手机前三
  1月16日消息 1月16日消息,拼多多年货节负责人对外公布大促数据,自12月20日零点至1月15日24点,整体订单同比增长260%,GMV超千万的单品近200种。其中,活动商家的农(副)产品订...
日期:10-15
pingcap校招_赋能社区 PingCAP University 培训课程2.0重磅升级
  经过半年时间的持续打磨,PingCAP University 迎来了一次重大升级,发布培训课程 2.0。   作为世界级的开源项目,经过四年的发展,TiDB 在越来越多的场景里落地,正逐渐被视为...
日期:05-16
马斯克计划“省掉”推特免费午饭:一年能节约超9000万元_马斯克推特转发
在想出大批量裁员、开放蓝V”购买等系列操作后,马斯克为了让推特开源节流,将目光放在了旧金山总部员工的餐桌上。以太坊2016年被盗怎么解决的谷歌手机pixel升级安卓10好用吗近...
日期:11-15
传感器产品技术-工业级加速度传感器解析_加速度传感器构造
  传感器是获得精准有效数据的第一触点;它们在将原始物理量转换为便于测量计算的数据量的过程中,发挥着重要作用。伴随着电力、船舶、航空、航天等多种工程技术的迅猛发展...
日期:07-16
10亿大爆仓!美元升值压垮币圈,比特币以太坊高位回撤已7成;更有头部平台暂停取款…
美元指数飙升至20年新高,带来的不仅是全球货币下挫,还有加密货币市场的腥风血雨。9月7日,比特币和以太坊两大加密货币龙头再次双双暴跌,盘中最大跌幅分别超过6%和10%。根据英为...
日期:09-09
中国联通喜提eSIM  联手京东要发起一场智能设备革命?(京东通信esim)
  说到SIM卡,大概所有人都不会陌生,一张小小的卡片,便承载了每个人与“世界”联络的重任。最近,“eSIM”一词迅速成为了人们街头巷尾热议的话题,eSIM,全称为Embedded-SIM,即嵌入...
日期:07-01
比亚迪:海豹10月销量达11267辆 环比增长50.8%「比亚迪汽车9月销量快报」
11月7日 消息:今日,比亚迪汽车公布数据称,海豹10月销量达11267辆,环比增长50.8%。转转平台交易可靠吗此前,比亚迪公布数据称,10月新能源汽车销量21.78万辆,本年累计销量139.79万辆...
日期:11-14
诺基亚股市行情_诺基亚股价重挫被剔出Stoxx欧洲50指数
新浪科技讯 北京时间9月17日上午消息,在市值大幅缩水后,诺基亚的声誉将再次遭到重大打击,该公司将被剔除出针对欧洲最大公司设立的STOXX Europe 50基准指数。 诺基亚今年以来...
日期:07-23
360独立发现Flash“天窗”漏洞 90%以上网民电脑面临风险_flash漏洞分析
  北京时间4月12日,360安全中心发布重大安全漏洞警报,称其发现一个新型的Adobe Flash“天窗”漏洞。利用该漏洞,木马可通过恶意网页、Excel表格、Word文档、电子邮件等途径...
日期:07-27