您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-07 00:49:39  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

马斯克用的推特

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
「iPhone 15、15 Pro都有 「苹果发布全新硅胶保护套」」「iphone硅胶保护壳」
来源:中关村在线赶集网免费发布苹果公司今年为iPhone 15和iPhone 15 Pro系列机型推出了全新的硅胶保护套。这些保护套在颜色和尺寸上与之前的版本有所调整,但整体设计与之前版...
日期:09-15
谷歌给员工“断网” 2000多人一下回到远古时代_谷歌方面
凤凰网科技讯 北京时间7月19日消息,谷歌公司将在周三启动一项新的试点计划,部分员工只能使用没有接入互联网的台式机。谷歌称,这么做是为了降低网络攻击风险。oppo find x6pro...
日期:07-19
13位院士共襄航空盛会,《张彦仲传》正式首发「张彦仲大飞机专项」
7月21日,2023航空航天(无锡)产业创新发展大会在江苏省无锡市召开,中国工程院院士张彦仲、谭建荣、金东寒、樊会涛、王华明、向巧、吴光辉、王向明、朱坤,中国科学院院士丁汉、李...
日期:07-22
天能致敬追梦人:开年有礼 买电池赢红包
  春节结束了   短暂的团圆过后   是漫长的离别   我们身边总有这样的人   为了给予家人更好的生活   为了追逐自己心中的梦想   离开家乡,踏上征途...
日期:02-01
电子商务生态圈_中国电商生态圈进入2.0时代 融资热潮一触即发
电子商务服务产业正在掀起一场革命?!商业革命都有自己的生命周期,电商服务产业正处于产业集群、创新和市场潜力的不断扩展的阶段,电商生态圈进入2.0时代,会有大量的新技术新产品...
日期:07-24
11.11爆品环比增长60倍,看京喜如何赋能20年袜业老厂再次腾飞?
  置身于互联网时代下,传统产品在互联网赋能下实现腾飞,高品质的产品与优秀的线上运营平台缺一不可。同时,越来越多的传统制造企业希望发展自己的自主品牌,将自己的产品更多...
日期:04-05
iPhone14 Pro真机提前上手,没刘海就是香_iPhone14有刘海吗
中关村在线消息:8月18日,虽然距离iPhone新品发布会已不足一个月,但有关新机的配置以及渲染图已经曝光了不少,但这些都是猜测,并不能代表最后的真机。腾讯视频V视界大会近日,有关iP...
日期:09-25
移动创业者新机遇 淘宝联合支付宝举办开发大赛_支付宝和移动公司最新活动
  “逛街的时候掏出手机比比价格,在等车的时候给自己充个话费,走小运的时候买个彩票试试手气,花一毛钱看网络小说,无聊的时候在手机上逛逛店铺。”这已经成了很多用户的日常...
日期:07-28
天玑9200旗舰正式发布:OPPO Find X6已上架「oppo天玑900相当于骁龙多少」
今天下午发布的OPPO Find X6搭载了联发科旗舰级天玑9200移动平台,天玑9200采用了先进的台积电第二代4nm制造工艺,基于新一代Armv9架构,Cortex-X3超大核心频率高达3.05GHz,同时率...
日期:03-24
tiktok东南亚下载地区排行「TikTok、Lazada混战:东南亚电商的“面子”和“里子”」
声明:本文来自微信公众号“全天候科技”(ID:iawtmt),作者: 张超,编辑:罗丽娟,,授权转载发布。东南亚,因其庞大的人口红利和较高的互联网渗透率,成为电商掘金下一片沃土。背靠“东南亚...
日期:04-11
权威入选 | 万里数据库入选IDC“中国分布式关系型数据库应用最佳实践”报告
近日,全球领先的IT市场研究和咨询公司IDC正式发布《IDC PeerScape:中国分布式关系型数据库应用最 佳实践》报告,集中展示了中国分布式关系型数据库应用实践方面的优秀案例。其...
日期:12-13
王者荣耀周年庆皮肤限时免费「《王者荣耀》七周年庆新活动上线:今日登陆免费送史诗级皮肤」
最近几天,《王者荣耀》手游迎来了7周岁的生日,官方也举办了一场七周年庆活动,给玩家们带来了丰富的福利。根据官微消息,《王者荣耀》游戏内今天正式开启两场新活动:【很高兴遇见...
日期:10-31
出街百搭!闪魔E07真无线蓝牙耳机全新上市「闪魔pd20w」
3C数码配件品牌闪魔在品牌全面升级后,再有大动作。近期,闪魔E07 真无线蓝牙耳机全新上市,硬核性能搭配马卡龙配色,科技与时尚并存,并支持多种DIY创意玩法,炫出个性化风采!火箭发射...
日期:05-12
视频号,渐入佳境_视频号,渐入佳境怎么做
声明:本文来自于微信公众号 孟永辉(ID:menglaoshi0071),作者:孟永辉,授权转载发布。马化腾将视频号看成是「全公司的希望」,这一点是没有任何夸大的成分的。可以说,如果微信在视频...
日期:01-16
Redmi Note13 Pro全系开启预约:首销送一年碎屏保
快科技9月19日消息,Redmi Note13 Pro系列新机已定档9月21日晚7点发布,目前新机已经开启预约。据Redmi红米手机今日预热,Redmi Note13 Pro全系首销全送一年碎屏保”。在保障期内...
日期:09-20
OPPO Pad Air2正式发布:学习首选的护眼平板_oppo智能护眼
11 月 23 日,OPPO正式发布全新一代OPPO Pad Air2,新品配备2.4K超清分辨率和90Hz高刷的护眼大屏,支持硬件级防蓝光和独 家屏幕色温调校,提供出色的护眼效果。同时,OPPO Pad Air2...
日期:11-23
研究机构警告:人工智能的兴起只会让科技巨头变得更强大_人工智能蓬勃发展
4月26日消息,高昂的人工智能技术开发成本,致使许多初创公司需要依赖微软或亚马逊等大型科技公司的云平台来开发相应产品。研究组织AI Now表示,这种状况只会让大型科技公司越发...
日期:04-26
iPhone 16新按钮功能曝光,这可能是近几年最值得期待的苹果手机_ios15按钮形状
此前有爆料称,将于明年发布的 iPhone 16 系列所有机型都将新增一枚按钮,名称为 Capture Button。它将取代美版 iPhone 机型上的毫米波天线,位于电源键下方,而毫米波天线则是将转...
日期:12-19
滑雪不会刹车女生一路靠吼下坡 网友调侃练河东狮吼:医生科普受伤有多严重
冬季的到来,最适合的体育活动,可能没有比滑雪惬意了吧?近日,有网友纷纷晒出了滑雪的视频,一些女生滑雪不会刹车一路靠吼滑下坡,这也引起了网友吐槽。有网友表示:她们这不是在滑雪,是...
日期:01-04
华为Mate 50系列或月底开启预热:至少三款 发布时间与iPhone 14撞期(华为mate 50 plus什么时候上市)
据多方消息,华为Mate 50系列将会在下个月正式登场,发布会日期可能与iPhone 14系列相近,会在9月中上旬。根据博主厂长是关同学最新消息,华为Mate 50系列将会在本月底开启筹备预热...
日期:08-19