您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-04 23:51:33  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

中兴推出wifi 7标准5g cpe

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

特斯拉股价下降

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
九牧运营总裁林晓伟:只要能找到应用在产品的好技术就可以合作
凤凰网科技讯 3月31日下午消息,“科技卫浴 数字中国 九牧数智卫浴战略暨i90数智马桶新品发布会”在北京凤凰中心隆重举行,这是全球卫浴行业首次以“科技卫浴战略”为主题的发...
日期:04-01
端午联通营业厅放假吗「来联通营业厅 别样端午放“粽”一夏」
来联通营业厅 别样端午放“粽”一夏 通信产业网|2023-06-21 09:58:43作者:王欢来源:通信产业网【通信产业网讯】初夏,微风不燥;乍眼,繁花漫山。转眼间到了农历五月初五。据《荆楚...
日期:06-21
从更新迭代中找寻发展OpenHarmony技术大会编程语言及开发框架分论坛召开
科技行业注重与时俱进,秉持创新不息的精神,编程语言和开发框架是影响应用体验和应用生态的关键要素,持续更新与发展至关重要。从编程语言Javascript/Typescript,Python,Java,Kotli...
日期:11-06
辅助驾驶功能新车市场渗透率超三成 是否“鸡肋”引热议_汽车辅助驾驶系统的现状
  中新网9月27日电(中新财经 葛成)辅助驾驶“白送可以,付费不行”,这一观点最近引发热议。业内对辅助驾驶功能是不是“鸡肋”争论不休,用户对于辅助驾驶的安全性也有担忧,但不容...
日期:09-27
redmi k20 pro真旗舰「Redmi首款旗舰!K20系列成为全面屏标杆:120万钉子户至今在用」
快科技11月29日消息,在Redmi K70系列发布会上,小米集团卢伟冰回顾了Redmi曾经打造的经典机型,其中一款是Redmi K20系列。redmi k30 pro 发布会卢伟冰目标卢伟冰表示,研发K20系列...
日期:11-29
谷歌联手15家团购网站对抗Groupon(谷歌购物平台)
  北京时间10月29日上午消息,谷歌对团购业务做出重大调整,宣布旗下Google Offers将与Gilt City等15家团购网站合作。   Google Offers旧金山湾区的订户将率先体验到此次...
日期:07-24
滴滴回应“闪崩有司机收入超690亿”:图是P的 司机提现功能一切正常
快科技11月28日消息,针对滴滴闪崩有司机收入超690亿”的报道,滴滴官方回应称,经过核查,证实该图是PS伪造的谣言。昨晚以来,滴滴崩了”相关话题登上微博热搜。有媒体报道称,有司机...
日期:11-28
美国科技行业出现降薪潮 高薪时代将走到尽头?_美国高科技企业完蛋了
北京时间5月30日早间消息,据报道,近期,美国科技行业的从业者开始担心,科技行业的高薪时代可能将走到尽头。上月,匿名求职网站Blind上的一项调查吸引了数千次投票。用户纷纷讨论,科...
日期:09-26
油管AI网红Siraj承认抄袭再上热搜:网课骗钱,人设崩塌
  Siraj在AI圈有多火呢?   仅仅在Youtube上,他就有仅70万订阅者,包括DeepMind创始人Demis Hassabis也是他的“粉丝”,简直堪称是机器学习界的“papi酱”。       除...
日期:02-26
微软亲自出手:更多Win11/10设备获得暴力破解保护_windows 11 破解
在每个领域,都存在一些类似于力大飞砖”的技术,网络安全中的暴力破解就是一个典型的例子。所谓暴力破解,指的是攻击者通过穷举的方式,强行尝试一个账号的密码,在没有适当安全工具...
日期:10-13
小程序地推月增180万支付用户?微信官方携手CoCo都可“授课”
  用户从哪儿来?行走的人流、消费的顾客都是“散点流量”,“地推”是用户增长的关键一步。CoCo都可就用2个月覆盖全国2200家门店的地推速度,让小程序快速被消费者接受,实现...
日期:04-17
乐华天团携手望京小腰7.17苏州天空之城震撼来袭
  乐华的王者天团们将在7.17的苏州2077天空之城闪亮登场!   在这里,热爱和坚持都成为了旅行,所有风景都经由芳菲铭记。各位绝世爱豆们将在这里惊艳亮相,快来为他们应援,给...
日期:02-25
男子网购耐克鞋却挂着李宁的吊牌 网友:联名款?「耐克官网李宁」
据都市现场报道,上海一男子网购一双耐克鞋,却挂着李宁的吊牌,而且还有平台鉴定为正品的证书。京东apple产品自营店从视频来看,该男子4月6日收到了从得物平台购买的耐克Air Monar...
日期:04-09
网店兜售三寸金莲缠足袜299元一双 网友纷纷表示震惊_三寸金莲裹脚鞋
在一个二手交易平台上,竟然有许多店家出售各式各样的“三寸金莲”鞋和相关的缠足用品,这些鞋袜样式五花八门、品类繁多,价格从几十元到上千元不等,甚至有店家以“小脚鞋”的名义...
日期:04-12
讯飞办公系列产品——新中产职场人群的选择(讯飞智能办公本怎么样)
  12月30日,吴晓波年终秀在厦门国际会展中心如期举行。财经作家吴晓波发表了跨年演讲,盘点这一年的经济起伏并对即将到来的2020作了八大预测。场景实验室创始人吴声作为特...
日期:05-05
荣耀100Pro、vivoS18 Pro、OPPO Reno11 Pro对比_oppor11plus和荣耀v10哪个好
在大家关注基于高通骁龙8Gen 3平台旗舰之时,中端机型这段时间也是频发,并且有很多机型的定位甚至是用户群都是重叠的。比如:vivo S18系列、荣耀100系列、OPPO Reno11系列这三款...
日期:12-18
特斯拉上海超级工厂年底正式投产「特斯拉上海超级工厂4月交付超7.5万辆」
5月5日消息,乘联会发布预估销量,4月特斯拉上海超级工厂共计交付75,842辆。蔚来汽车特斯拉差距多大智联招聘CEO郭盛同日上午,特斯拉中国大陆官网显示,全新Model S/X全系车型上调...
日期:05-05
消息称Meta将进行新一轮裁员:最快本周削减数千名员工「meta team」
  讯 北京时间3月7日上午消息,据报道,据知情人士透露,Facebook和Instagram母公司Meta正计划进行新一轮裁员,该公司最快将于本周裁减数千名员工。windows1020h2更新  去年11...
日期:03-07
魅族推出 XR 品牌 “MYVU” 采用FlymeAR交互系统_魅族selection
11月27日 消息:2023魅族秋季无界生态发布会将于11月30日14:30举行,届时将发布 AR 眼镜、全新 Flyme 及 Flyme Auto 生态系统、魅族21、PANDAER 等产品。星纪魅族集团今天揭晓...
日期:11-27
一加Ace 3已备案:全球首发1.5K东方屏_一加屏幕是什么屏幕
快科技12月6日消息,博主数码闲聊站透露,一加Ace3已经备案,这款新品首发1.5K东方屏(一加12首发2K东方屏),屏幕峰值亮度和调光方案看齐一加12。据悉,一加Ace3的屏幕尺寸是6.78英寸,由...
日期:12-06