您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-06 06:40:07  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

9月会发布apple watch

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

戴尔显示器p2416d

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—

rog光刃g15


返回网站首页

本文评论
中国电信云网融合大科创装置:应用消费级显卡助力大模型训练推理
通信世界网消息(CWW)面对《美国对华芯片出口管制》对中国大模型发展带来的巨大冲击,中央网信办于2023年10月18日发布了《全球人工智能治理倡议》。该倡议旨在通过开展针对低资...
日期:01-17
估值高达4700亿元,芯片巨无霸来了!最大客户来自中国,英伟达、苹果、谷歌出手了
每经编辑:毕陆名软银集团旗下芯片巨头ARM于当地时间9月5日正式提交了IPO申请文件显示,公司每股ADS定价在47-51美元之间,预计总计发行9550万股ADS。据媒体报道,ARM整体估值达640...
日期:09-06
电脑“黑屏”搞晕网友原是木马“团伙作案”_电脑中木马病毒黑屏怎么办
  360安全中心近来接到不少网友求助,电脑开机后一片“黑屏”,显示器中央还会弹出一个奇怪的空文件夹。大多网友怀疑自己误安装了传说中的Windows“黑屏补丁”。对此,360安全...
日期:07-25
老爸调侃女儿放学玩秋千被当场反击 一句话戳到老父亲痛处_爸爸荡秋千歇后语
最近,山东一名父亲在女儿放学后戏弄她,却没有想到遭到了女儿强烈的回击。这个父亲调侃女儿,说她的班级有七个同学考了满分,而她还好意思去玩秋千。然而,女儿毫不畏惧地回应道:"我...
日期:11-04
长远来看电动汽车可能比燃油车性价比省钱-或可节省超6000美元 专家
4月24日消息,在政府政策、技术进步和环境问题等因素刺激下电动汽车的销售将会变得更火爆。根据芝加哥大学和美联社最近联合展开的民意调查显示,到目前为止,41%的美国人至少在某...
日期:10-01
中概教育股集体暴跌原因「中概股周一多数下跌 见知教育暴跌55% 拼多多大涨近15%」
谁是雅虎现在的ceo三星618活动  北京时间30日凌晨,美股周一收跌,延续了上周五的下跌趋势。对美联储激进加息和收紧货币政策的担忧仍然笼罩市场。欧央行官员警告称,即使付出经...
日期:08-31
美国股票英伟达实时行情「美股周一:英伟达涨超8%,法拉第未来跌逾17%」
8月22日消息,美国时间周一,美股收盘主要股指涨跌不一,纳指涨幅超过1%,且在过去五个交易日以来首次上涨。长期美债收益率再次飙升,同时投资者对海外经济仍存在担忧。道琼斯指数收...
日期:08-22
toshiba手机
Toshiba是日本的一家知名电子公司,它涉足了许多领域,如电脑、电视机和手机等。其中,Toshiba手机也是备受关注的一个品类,这里将会介绍一些关于Toshiba手机的相关信息。在很多人...
日期:05-31
VIAVI推出NITRO Wireless,提供云智能和自动化以加速5G和6G
通信世界网消息(CWW)近日,VIAVI宣布推出NITRO Wireless,提供一套组合解决方案,使生态系统中的所有参与者(设备制造商、服务提供商、半导体公司、软件开发商和系统集成商)能够通过智...
日期:10-13
东方甄选向网红铁头发律师函:扭曲事实 恶意维权
10月13日 消息:东方甄选就近期遭打假博主“铁头惩恶扬善”抹黑一事发布声明。东方甄选强调,“铁头惩恶扬善”以打假为名,扭曲事实,恶意维权,发布大量抹黑东方甄选的言论,严重侵犯...
日期:10-15
灰帽子安全中心声明:请360停止抹黑“杀软宪兵”
昨日,杀软宪兵发布后,得到了广大杀软爱好者的热烈响应,但也遭到了卡机排行榜中靠前的厂商的谩骂和质疑。但是奇怪的是,某些厂商一边谩骂,一边又 偷偷的修改产品来提升成绩。我们...
日期:07-22
华为首席供应官应为民:人工智能芯片在半年时间需求增长了十倍以上
在2023年世界半导体大会暨南京国际半导体博览会上,华为技术有限公司的董事兼首席供应官应为民发表了演讲。华为p60百度百科戴尔成就vostro3000怎么样苹果iphone销量创两年应...
日期:07-20
电脑技术交流网站「电脑技术交流」
已逐渐成为信息化时代中不可或缺的一部分。在当今的社会中,电脑技术应用到了各个方面,人们的工作和生活中都已经离不开电脑。同时,电脑技术的发展也日新月异,市场上不断涌现出各...
日期:05-29
极致性能+低碳先锋   全形态联想ThinkCentre M大师系列全系亮相
通信世界网消息(CWW)在6月6日的“商用为本·2023联想商用产品发布会”上,联想ThinkCentre M大师系列高端商用台式机产品正式亮相。新品包括面向高性能办公、创意设计的旗舰M9系...
日期:06-07
三星S24系列手机日销17万台 周销121万 打破最高记录_三星s20销量情况
【手机中国新闻】1月26日,手机中国注意到,三星电子官方表示,从1月19日至1月25日,为期一周的Galaxy S24系列韩国国内预购数量录得121万台,打破了三星手机的销售纪录。据悉,三星S24...
日期:01-26
小米模仿华为「“原创”与“抄袭”之争,华为小米孰对孰错?」
通信世界网消息(CWW)小米和华为再次上演专利之争。12月12日,小米发表声明称:“近日,余承东先生无端针对我司‘龙骨转轴’技术发布不实言论,与事实严重不符。”卢伟冰红米note11而...
日期:12-14
小米双11开门红:70分钟支付金额破30亿元 500款产品优惠_小米双十一优惠活动
今晚20:00,双11促销季全面开启,各大厂商第一时间公布了自家销量战报,继Redmi Note 12系列首销1小时销量破25万台后,小米公司宣布,小米双11用时仅1小时10分,全渠道支付金额突破30亿...
日期:11-07
2020年11月南宁动物园门票多少钱「五一假期南宁动物园人山人海挤得无法动弹:官方建议改天再来」
五一”假期第二天,你以为的景区是人人人人人人”但其实是众众众众众众”,从游客在网上晒的各大景点排队图来看,真的是人挤人”模式。经常刷短视频的同学应该都刷到过南宁市动物...
日期:05-01
美国科技巨头地图产品“迈出巨大一步”:沉浸式_美国创意地图
凤凰网科技讯 北京时间9月29日消息,谷歌在当地时间周三的第三届年度搜索活动上表示,该公司将为一些地点推出“沉浸式视图”和“氛围”,添加一些视觉形式细节,方便用户提前探索相...
日期:10-02
100%正品机源!华为Mate 50/Pro、Pocket S官方翻新机开售:3699元起_华为mate有翻新机吗
快科技12月25日消息,从华为商城获悉,华为Mate 50、Mate 50 Pro、Pocket S官方翻新机上架开售。 三款机型均为256GB版本和一种配色,售价分别为3699元、4499元、3899元。一加...
日期:12-26