您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-04 15:47:16  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

动力电池成本趋势

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
Win10/11神软发布:当年用XP系统的快乐回来了「XP win10」
还在坚持使用Windows XP系统的朋友应该不多了,但换个方式问下大家,正在用Win10/11的你,还怀念XP吗?共享充电宝要不要钱或许是为了满足这部分用户的喜好,知名自定义美化工具Stardo...
日期:10-01
李想:奔驰S体验太糟 理想L9在D档低速行驶时 超声波雷达依然工作「奔驰理想one价格」
快科技6月27日消息,昨天理想汽车CEO李想发文称:D档向前行驶,360全景检测的12颗超声波雷达是不工作的,并表示(如果)D档也工作,只要是正常人都会疯掉。台湾零售大王昨晚李想再次发文...
日期:06-27
罗德与施瓦茨联合紫光展锐验证了业界首个3GPP Rel.17 IoT NTN射频一致性测试用例
通信世界网消息(CWW)罗德与施瓦茨(以下简称"R&S"公司)与紫光展锐合作,在基于紫光展锐5G NTN卫星通信芯片V8821上验证了业内首个IoT NTN射频一致性测试用例。这一成就标志着双方在...
日期:10-08
官方认可!两颗128核心的AMD EPYC 轻松碾压四颗60核心的Intel至强
近日,中国电子技术标准化研究院组织计算产品相关企业代表和行业专家,就2023年第一轮CPUBench公开测试活动提交的报告进行了审查。网络安全 rss与会专家从测试数据合理性、测试...
日期:09-11
ChatGPT使用数据曝光 访问量和编程需求自5月开始持续下滑_chat top
9月14日 消息:近日,美国社交媒体分析公司SparkToro公布了一组关于ChatGPT使用情况的数据分析结果,发现ChatGPT的使用量和编程协助需求从5月份开始出现明显的下降趋势。SparkTo...
日期:09-14
又一批鸿蒙3.0测试版名单开放,Nova老用户终于等到了「鸿蒙升级nova」
鸿蒙Harmony 3开启了新一轮测试招募,招募报名截止到10月 13日,华为MatePad系列和华为Nova系列用户可以通过“我的华为 / 会员中心”App-首页-升级尝鲜入口进入报名。报名成功...
日期:10-10
网易云杜比音效设置「网易云音乐 PC 客户端开始支持杜比全景声」
11月18日消息:网易云音乐宣布最新PC客户端已支持杜比全景声,用户可通过支持杜比全景声功能的Windows设备在网易云音乐客户端体验。刘庆峰科大讯飞股份有限公司董事长、总裁据...
日期:11-19
ARM大变脸 要对高通“赶尽杀绝”:不给授权开发CPU「高通和ARM」
和NVIDIA的联姻失败后,ARM公司似乎正考虑大幅调整自己的经营方式。日前,高通在反诉ARM的文件中提到,后者酝酿在2024年后(2025年起)不再给半导体公司颁发完整的IP授权,而是直接给OE...
日期:10-29
中国联通携手华为,高品质万兆全光工业园区场景化方案首次亮相宁波智博会
通信世界网消息(CWW)10月13日,由宁波市政府、浙江省经信厅、中国联通等共同主办的2023世界数字经济大会暨第十三届智博会在浙江省宁波市正式开幕。大会期间,中国联通携手华为首...
日期:10-15
苹果发布 macOS Ventura 13.4 RC2更新:优化Apple New「mac 13.3」
IT之家 5 月 12 日消息,苹果今天面向开发人员,发布了 macOS Ventura 13.4 的第 2 个候选 RC 版本(内部版本号 22F63),距离上个候选版本相隔数天时间。扎克伯格未来估值已经注册的...
日期:05-12
打造健康服务新生态,思必驰推出“1+2”智慧医疗方案(健康医疗智能产品)
  在国家政策及医疗需求的推动下,我国AI医疗行业市场规模在快速扩容。   据中国电子学会统计数据显示,到2021年医疗人工智能行业市场规模将达到75.3亿元。根据艾瑞咨询...
日期:06-26
追觅科技亮相CES 2024:以全球视野开启智能家电新纪元_追觅科技怎么样?
1 月 9 日, 2024 年国际消费类电子产品展览会(CES 2024)在美国内华达州拉斯维加斯正式启动。全球领先的智能家电科技公司——追觅科技,携其全品类智能家电产品惊艳亮相,引发海内...
日期:01-11
比亚迪卖给谁了「比亚迪曾将魏商标转让给长城汽车」
5月25日 消息:近日,长城官方举报比亚迪引发广泛关注。对此,比亚迪发布声明称,坚决反对任何形式的不正当竞争行为,并保留法务诉讼的权力。地球物理学进展是sci吗而双方上一次共同...
日期:05-25
OPPO Find N3折叠屏手机曝光:1英寸大底、双屏_oppo三折叠
据最新爆料,OPPO Find N3将首次在折叠屏手机上采用双层晶体管CMOS影像传感器,这将大幅提高进光量并减少噪点,实现接近1英寸大底效果。这意味着用户可以在更小的尺寸下获得更...
日期:09-12
马斯克:希望20年内在火星建造自给自足城市(马斯克想火星建工厂)
世博会讲解员为什么苹果系统更新后相册需下载五菱凯捷五座车听歌识曲网易云8.0小米米家空气净化器2s价格   特斯拉和SpaceX公司CEO埃隆·马斯克周末重申,他坚定不移地致力...
日期:08-16
3d打印技术在生物制药领域的应用现状「再制生物学:3D打印器官的未来展望」
近年来,再制生物学领域取得了令人瞩目的进展,特别是在3D打印器官方面。这项技术为医学界带来了前所未有的机遇和挑战,让我们能够重新定义人类健康和生命的未来。在这篇文章中,我...
日期:06-23
高通骁龙八「高通骁龙8 Gen3性能爆发:台积电代工」
有消息称,骁龙8 Gen3芯片将在3季度发布,比以往要早一些,其内部编号为SM8650,使用台积电的N4P工艺制造。处理器部分采用了四组八核心设计,包括一个超大核Gold 、两个大核Titanium...
日期:04-23
英特尔新的Wi-Fi芯片有望应用到Meta Quest VR头戴设备
凤凰网科技讯 北京时间1月11日消息,英特尔和Meta联手开发了一种新的方式。如果你的电脑配置是AX1690 Wi-Fi芯片,那么可以将Oculus Quest头戴设备直接连接到游戏PC。该方式通过...
日期:01-11
徕卡专业影像加持 还将进军海外市场 小米13-Ultra或4月初国内上市
虽然在MWC上,全新的小米13、小米13 Pro已登陆海外市场,但此前备受瞩目的小米13 Ultra旗舰新机并没有如期亮相,而据多方爆料,小米仍将在近期推出这款顶级旗舰,截至目前关于该机的...
日期:09-19
微软:Xbox Series S 将很快获得内存性能提升_xbox series s加载速度
IT之家 8 月 5 日消息,微软最近发布了 2022 年 6 月游戏开发工具包 (GDK),新版本带来了大量新功能和改进。虽然发行说明主要是针对开发人员的技术术语,但该公司还发布了一段视...
日期:09-04