您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-06 21:09:03  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

川普Twitter

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
这个「常规」IP打法卡住了多少团队的脖子
声明:本文来自于微信公众号 游戏葡萄(ID:youxiputao),作者:灰信鸽,授权转载发布。游戏做动画这件事好像已经变得寻常起来。尤其是今年。就连在衍生动画这块一直不温不火的欧美系游...
日期:12-24
iPhone 16全系搭载120Hz刷新率!“Ultra”版本有这功能_iphone1260赫兹刷新率
据苹果产品博主Majin Bu的爆料,苹果即将发布新款手机iPhone 16,而其中的顶配机型有望被命名为Ultra。这款新型号 iPhone 16用三个新的小型摄像模组与Vision Pro头带配合使用...
日期:09-26
国民级仙侠巨作!国漫《凡人修仙传》新年番今日上线:B站独播_凡人修仙传2021年番
快科技11月25日消息,据凡人修仙传动画剧”官微消息,最具真实感的国民级仙侠巨作,《凡人修仙传》新年番星海飞驰篇”今日正式开播,由B站独播,每周六上午11:00更新。韩立出关,终成结...
日期:11-25
知情人士 系MJ自主入驻及招募-Midjourney中文版在QQ开启内测?
【】5月16日消息,昨日晚间,Midjourney AI在微信发布《Midjourney官方中文版 · 内测申请》的通知,邀请中国创作者加入Midjourney官方中文版内测,Midjourney中文版搭载在QQ频道上...
日期:09-28
苹果新头显要来了,但AR走到“无人区”_苹果ar镜头
今年6月初苹果首款头显设备Vision Pro的发布像一枚炸弹引爆了整个AR行业,大家都在期待苹果的下注为行业带来拐点时刻。对于普通消费者来说,超过2万元的售价使不少人望而却步。...
日期:11-13
动视暴雪母公司「动视暴雪CEO科蒂克今天卸任!离职补偿高达1.1亿元」
快科技12月29日消息,根据微软发布的通过,动视暴雪首席执行官鲍比科蒂克(Bobby Kotick),将于今天(12月29日)正式卸任,而其离职补偿更是高达1.1亿元人民币。618优惠券好抢吗在科蒂克正...
日期:12-29
一年 200 亿美元都不赚?苹果这是中了什么邪?_苹果一年总收入
去年我们写过一篇文章,里面提到谷歌为了 “ 收买 ” 苹果,每年向苹果支付 150 亿美元,只为苹果默认使用谷歌的搜索引擎。原因也很简单——对于谷歌来说,有一半的搜索流量是来自...
日期:11-27
国产屏幕出现漏光 被苹果取消iPhone 15系列全部订单「苹果国产屏会漏液吗」
苹果iPhone 15系列预计会于9月发布及上市销售,其屏幕现正大规模生产。在三个屏幕供应商当中,只有三星符合要求可以生产,而LG在改进技术后也很快能满足苹果的条件,但只有国内...
日期:08-04
iPhone或制霸美国市场!成为最热产品「苹果产品已经风靡全球」
中关村在线消息:10月12日,据相关爆料,苹果设备或已成为最受美国青年青睐的产品,该品牌拥有87%的年轻用户群,并且有88%的用户依然希望下一步手机是iPhone。根据统计来看,苹果在近十...
日期:10-14
科技巨纷纷后布局智能聊天机器人 ChatGPT概念股持续拉升
1月31日 消息:去年年底,人工智能软件ChatGPT亮世后一炮走红,具备闲聊对话、文学创作、书写代码等功能,发布短短5天后就累积了超过100万用户。二维码受欢迎的原因今年1月23日,微...
日期:01-31
双11苹果大促:iPhone 13仅4388 iPhone 14史低4999「iPhone13起售价5499元,9月首发,首批订单或破亿」
今年的双11为了刺激消费,促销活动还是很大的, 目前热销机型iPhone13、iPhone 14在今年的双十一开始了特价。首先是iPhone 14,跌价优惠券现在立减1000元,到手只要4999元,目前4999...
日期:11-10
三星2022年「未来显示生而不凡:2023三星MICRO LED技术品鉴会正式登“鹭”」
7月15日,全球首次三星MICROLED技术品鉴会在厦门举办,展示89英寸级、110英寸级家用MICROLED以及三星TheWallIWA商用显示器,探讨MICROLED背后的创新技术理念与最新的市场需求。在...
日期:07-17
谁来治治新能源的吹牛症?「新能源汽车吹牛」
新能源,天天都有新花样。去年新能源汽车领域嘴炮一个接一个:“500万以内最好”、“遥遥领先”,主打的就是一个放狠话。而今年如果关注新能源汽车新车发布会的车友们则不难发现,...
日期:07-27
缅北电诈真相:95%的人是自愿 网友:这就是人性_缅北电诈人员身份信息名单
近期报道揭示了缅北电诈聚集地的情况,警方透露95%的电诈者自愿前往从事此活动。警方干警老张在两年多的时间里成功劝返数千名回国人员,绝大多数都自愿前往缅北。这些年轻人多...
日期:08-29
亨鑫科技上市「硬核实力|亨鑫科技顺利通过国家高新技术企业复评认定」
通信世界网消息(CWW)1月16日,全国高新技术企业认定管理工作领导小组办公室根据《高新技术企业认定管理办法》和《高新技术企业认定管理工作指引》有关规定,发布了江苏省认定机构...
日期:01-26
特斯拉赛博充中国版发布:32A/7KW,重量13KG_特斯拉赛车版
特斯拉今日宣布对其家庭充电服务包进行更新,将安装服务改为国标10米。赛博充的售价从4900元起(降价600元),三代家充的售价从6800元起(降价1200元)。Cybervault充电桩是为中国市场...
日期:10-19
四川大学再回应部分男厕改女厕 将进一步完善优化方案「四川大学男神」
四川大学近期将部分男生厕所改为女生厕所的事件引起了社会的关注,这一做法遭到了一些男生的反对。学校之前向媒体回应说,这是因为女生和女教师反映厕所排队太长,之前没有和男生...
日期:05-13
英伟达的江山,还能坐多久?_英伟达支持sam
声明:本文来自于微信公众号 AI新智能(ID:alpAIworks),作者:举大名耳,授权转载发布。当下的AI赛场上,英伟达无疑是最闪耀的一颗明星。十多年来,英伟达在生产能够执行复杂AI任务(如图...
日期:09-05
京东双11高端手机销量榜TOP10:苹果霸榜前3 小米、华为各2款_2020京东双11手机实时排行榜
快科技11月2日消息,根据最新的京东高端手机榜单显示,苹果、小米、华为三家瓜分了TOP10。其中苹果独占6款,并且霸占前3名:iPhone 15 Pro Max起售价9199元,双11售出10万台。iPhone...
日期:11-03
微软修复4个安全漏洞 Duqu病毒藏身文档
  微软发布最新月度例行安全更新,修复了4个安全漏洞,但不包括Duqu病毒利用的漏洞。目前,国内外安全厂商和独立研究机构均对Duqu可能造成的威胁高度关注。昨天,金山毒霸发布应...
日期:07-24