您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-05 15:12:05  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

小米充电宝5000毫安口红版

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

苹果手机漏液怎么回事

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
寒潮大风暴雪三预警齐发!南方降雪进入鼎盛时段_南方降雪预报
快科技1月21日消息,从中央气象台官网获悉,中央气象台今天6时继续发布寒潮黄色预警、大风蓝色预警,以及2024首个暴雪蓝色预警。受寒潮影响,今明两天南方降雪进入鼎盛时段。预计1...
日期:01-21
2022人才发展报告:高学历青年成智能制造领域人才供给主力军_2021青年人才
【网易科技4月26日报道】近日,中国电子信息产业发展研究院联合智联招聘通过招聘数据分析我国智能制造及细分领域相关人才的需求、供给及薪资状况,发现智能制造发展需要大量底...
日期:04-26
紫光 sdram「紫光超级SIM卡已适配数百款机型 最大256GB存储空间」
近日,紫光超级SIM卡公布了最新适配手机列表,目前已有数百款机型适配。荣耀、中兴、OPPO等多款近期新上市的5G手机,以及华为新推出的4G手机,均支持超级SIM卡应用。紫光超级SIM卡...
日期:09-20
膨胀了?《羊了个羊》推币圈版涉嫌ICO,代币价格波动如过山车
图片来源:视觉中国  记者 |司林威  近日,火爆全网的小游戏《羊了个羊》悄然推出“GameFi”版本,而且其代币价格也在短时间内遭遇“过山车”般的剧烈波动。  9月中旬,微信消...
日期:09-27
vivoy100最新官方消息价格vivo Y100i今日开启预售 1599元入手12GB+512GB大内存
来源:中关村在线2023年11月28日,“越级大内存 实力长续航”vivoY100i今日开启预售。作为最划算的12GB+512GB手机,vivoY100i售价仅为1599元,还具备5000mAh超大电池、44W闪充、500...
日期:11-28
2023,抖音内容赛道“风”往哪吹?_2021抖音大风吹
声明:本文来自于微信公众号卡思数据(ID:caasdata6),作者:岳遥,授权转载发布。春节已过,2023年的大幕彻底拉开。在此之际,我们先一起回顾下2022年年末:看看2022年抖音内容生态如何...
日期:01-30
OPPO李明阳:手机市场下滑但折叠屏销量在提升 行业创新还未到止境
  讯 12月21日上午消息,OPPO近日发布了新一代折叠屏手机Find N2系列,包括横向折叠的Find N2,以及竖向折叠的Find N2 Flip,全系搭载OPPO自研芯片马里亚纳X,售价5999元起。OPPO产...
日期:12-21
有本事当面说图片「开电车去新疆腹地旅游!蔚来丝绸之路充换电站正式打通」
快科技7月19日消息,据蔚来汽车官方,丝绸之路正式贯通,全程3133km,共布局33座充换电站,从西安向西出发,途经张掖丹霞地质公园、莫高窟、天山天池、赛里木湖,抵达霍尔果斯,蔚来车主们...
日期:07-20
亚马逊ai人工智能「在生成式AI竞赛中,亚马逊宣称其低成本云计算优势」
7月12日 消息:亚马逊的云计算部门 Amazon Web Services(AWS)正通过价格竞争来与竞争对手在人工智能领域取得优势。AWS 副总裁 Dilip Kumar 表示,像 ChatGPT 这样的热门聊天机器...
日期:07-12
好评如潮PC大作!黑客修复《生化危机4重制版》破解补丁:更加完美了
上周末,大神EMPRESS(女皇)放出了《生化危机4重制版》的破解资源,完整游戏文件大小55.7GB,此次攻克距离游戏正式推出仅过去了1个半月时间。仅仅一天过去,EMPRESS更新了258MB的补丁,...
日期:05-17
互联网陷竞争泥潭 完善管理制度迫在眉睫(互联网时代管理面临的挑战)
  引发互联网地震的奇虎与腾讯“3Q之争”第一场诉讼——“腾讯起诉奇虎不正当竞争案” 12月14日在北京首次开庭。腾讯公司坚持要求奇虎360停止开发隐私保护器,360则逐条驳...
日期:07-25
北大韦神再现「北大放假网友火车站偶遇韦神 依然保持朴素风格」
日前,韦东奕暂时放下手头的科研工作,请假回家陪伴年迈的母亲,因为北京大学已经放寒假了。amd锐龙9测试近日,有网友在北京火车站偶遇了这位北大才子,发现他依然保持着朴素的风格,没...
日期:01-23
ChatGPT持续“高烧”,再走一遍元宇宙的老路
声明:本文来自于微信公众号锌财经(ID:xincaijing),作者:路世明,授权转载发布。2021年火爆全球的元宇宙散去“虚火”,2023年风靡世界的ChatGPT正在“高烧”。近日,微软解散了成立仅...
日期:02-15
孤注一掷出自哪里「《孤注一掷》故事原型有多恐怖 网友:远比电影更残酷」
电影《孤注一掷》根据真实事件改编而成,反映了近年来国内大量诈骗案例。影片讲述了一群被骗人、受害人在经济和心理上遭受创伤的故事。主要角色由张艺兴、王传君和金晨等人主...
日期:08-09
Redmi K60 Ultra定了!下月发布_红米k60价格
今早有消息称,Redmi K60 Ultra确定下月发布 ,目前已经在发布会前最后的准备中。暴风雪冰淇淋多少钱Redmi K60 Ultra将搭载联发科天玑9200 旗舰平台,该芯片采用了台积电先进的4n...
日期:06-12
11999元起!华为Mate60 RS非凡大师发布:一图看懂华为史上最高端直板机_华为mate60百度百科
快科技9月25日消息,在今天下午的华为发布会上,官方居然全程没介绍手机产品,但是在发布会结束后,却通过微博发文揭晓Mate60系列的最强之作华为Mate60 RS非凡大师。这是华为Mate系...
日期:09-25
售价25万还抢不到 NVIDIA最强显卡H100找到外援:产能大增30%「hd系列显卡」
快科技7月5日消息,由于AI火爆,NVIDIA的AI显卡现在是供不应求,其中高端的A100、H100尤其抢手,H100售价达到了25万元,厂商都是大批量下单,而NVIDIA也在加急下单,最近更是找到了外援,产...
日期:07-05
我在欧洲做共享充电宝,一小时收费25元「欧洲有共享充电宝吗」
声明:本文来自于微信公众号 霞光社(ID:Globalinsights),作者:郭照川,授权转载发布。关注出海赛道的投资人李沐走进北京一家小酒馆,他本想在吧台租借一部移动电源,却发现窄窄的台面...
日期:04-03
高德自研惯导增强定位技术,推出智能手机隧道导航解决方案_高德最新导航技术
3月30日消息,针对隧道内定位不准确这一行业顽疾,高德地图宣布已于近日推出全新的智能手机隧道导航解决方案,基于自主研发的VDR惯性导航增强定位(以下简称VDR惯导增强)技术,可大幅...
日期:03-30
快手发展前景如何「2023年如何在快手做内容、做变现?我总结了7种最成功的MCN类型」
声明:本文来自于微信公众号 新榜(ID:newrankcn),作者:云飞扬,授权转载发布。随着内容行业逐渐成熟,创作者的竞争正逐渐演变为幕后MCN机构的竞争。MCN机构往往能极大程度影响创作...
日期:05-31