您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-06 01:02:28  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

圆通快递市场占比

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

戴森吹风机普通版和礼盒版区别

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

香港恒生股价指数

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

oppoa17什么时候出的

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
苹果iPhone 15/Pro系列改用USB-C,可为AirPods或Apple Watch充电
通信世界网消息(CWW)美东时间9月12日,苹果公司召开其秋季新品会,本次新品会上主要发布了iPhone 15以及最新款的Apple Watch Ultra 2 智能手表。其中,四款iPhone15机型最值得关注...
日期:09-13
三星s4手机「三星4s」
关于“”,你所需要知道的一切容声冰箱?三星是全球知名的电子产品制造商,其产品覆盖了智能手机、电视、冰箱、笔记本电脑等多个品类。在智能手机领域尤其是颇有建树,每一年总能...
日期:06-03
保护壳“泄露天机”:三星Galaxy Z Flip5副屏神似文件夹「三星flip3副屏」
快科技5月8日消息,近日,多款三星Galaxy Z Flip5的保护壳渲染图曝光,展示了这款手机独特的副屏设计。外国人用小米手机华为智能眼镜获得专利从渲染图来看,Galaxy Z Flip5的副屏为...
日期:05-08
生而好战 5.9AGON!爱攻粉丝日携AGON PRO旗舰新品来袭,秀机宠粉嗨翻天!
  5月9日,冠捷科技旗下全球销量领先的专业电竞品牌AGON爱攻,通过线上直播的方式召开了主题为“生而好战 5.9AGON”的爱攻粉丝日暨AGON PRO旗舰产品发布会!冠捷科技副总裁兼...
日期:01-24
最超值的锐龙轻薄本来了!联想推出小新Air 14 2023锐龙版:锐龙7 7840U   2.8K高刷屏 首发3999元
联想在今年早些时候推出了小新Air 14 2023 超级本,搭载了第十三代酷睿P系列处理器,16GB 1TB版本售价4999元。现在搭载锐龙7 7840U的小新Air 14 2023锐龙版也来了,16GB 1TB版...
日期:01-01
京东CEO徐雷:百亿补贴是京东价格策略的一部分 效果超过预期「2021年京东百亿补贴活动多长时间」
3月10日消息:京东发布2022年第四季度及全年财报。财报显示,2022年第四季度京东实现净利润30亿元,上年同期净亏损52亿元,市场预期净利润28.85亿元。星网冲浪浏览器2022年,京东实...
日期:03-10
运营商TD互联结算起争议 电信联通叫苦不迭
  原本是一项对中国移动发展TD的重大扶持政策,但一年前开始实施的TD-SCDMA网络间互联结算优惠政策却在这一年中引起很大争议,其中缘由是中国移动收取的TD网络结算费用大大...
日期:07-25
谷歌CEO发动员令:全员参与测试ChatGPT竞品Bard
对抗ChatGPT!谷歌急发竞品Bard,几周内向公众开放 (来源:澎湃新闻) 2月7日消息,当地时间周一,谷歌首席执行官桑德尔·皮查伊(Sundar Pichai)在内...
日期:02-07
释放1英寸全部实力!小米13 Ultra支持可变光圈:重金打造
快科技4月13日消息,小米创办人雷军为小米13 Ultra预热。雷军表示,小米13 Ultra重金打造了徕卡1英寸可变光圈,这将会释放1英寸的全部实力。众所周知,光圈的大小决定单位时间内镜...
日期:04-13
游戏驿站是谁的公司「游戏驿站宣布CFO将离职」
北京时间7月28日早间消息,美国视频游戏零售商游戏驿站(GameStop)宣布,公司首席财务官Diana Saadeh-Jajeh将于8月11日离职。游戏驿站任命Daniel Moore为临时首席会计主管和临时首...
日期:09-19
订单已达150万台 特斯拉首台电动皮卡Cybertruck将于9月开启交付
快科技6月9日消息,据海外媒体报道,自2019年11月22日发布以来,最初计划于2021年年底开始量产Cybertruck。此前曾因中途修改以及相关供应链等问题,多次推迟发布。近日,特斯拉表示,Cy...
日期:06-10
小米12pro最新消息「澎湃OS官宣:小米12 Pro天玑版、Redmi K50系列等本月推送开发版」
快科技12月8日消息,目前小米13系列、Redmi K60系列已经陆续推送了澎湃OS正式版,取代了MIUI。希沃智能电子学生证根据澎湃OS官方最新公告,接下来一大批老机型也将加入进来。小米...
日期:12-09
没有人比米哈游更懂垃圾桶_游戏:没有人比我更
声明:本文来自于微信公众号 刺猬公社(ID:ciweigongshe),文 | 星晖 编 | 石灿,授权转载发布。4月的尾声属于《崩坏:星穹铁道》。2023年4月26日,来自米哈游的旗舰新作《崩坏:星穹铁道...
日期:04-30
黑龙江移动携手华为完成DRS创新试点,显著提升居民区5G网络体验,打造龙江幸福之家
2023/5/29 14:29 黑龙江移动携手华为完成DRS创新试点,显著提升居民区5G网络体验,打造龙江幸福之家   近日,黑龙江移动计划部、黑龙江移动哈尔滨分公司携手华为在哈尔滨市...
日期:05-29
猿辅导跨界做咖啡,第一家店开在北京王府井
  来源:36氪苹果10周年纪念版手机是什么型号  文/董柴玲  编辑/乔芊  在资本热捧的咖啡赛道,又迎来一位跨界入局选手。  今日,Grid Coffee首家门店正式落地北京,位于...
日期:09-10
北上广深开始 优衣库中国宣布涨薪:最高可提升44%_优衣库一年在中国赚多少钱
10月11日消息,优衣库中国宣布自2023年10月起实施薪酬调整,据悉,本轮调薪对象主要是北上广深的店铺全职员工和实习生,以及作为中坚力量的员工群体。本次调薪后,员工平均年薪涨幅跟...
日期:10-12
麦当劳涨价0.5至1元!穷鬼套餐1+1随心配不涨价_麦当劳不断升价
12月27日 消息:12月26日,麦当劳官方客服确认:12月27日起,麦当劳将对部分单品和套餐进行价格调整,并在各个点餐渠道进行明码标价公示。此次调价引起了广泛关注,成为热门话题。金...
日期:12-27
山药像脚掌「男子买到奇葩山药外形酷似人脚掌 实际上很常见」
一位广西的农民在收割山药的时候,意外挖出了一根像人脚掌一样的山药,引起了网友的热议。这位农民把这根山药的照片发到了网上,很快就吸引了很多人的关注和转发。这件事情也被当...
日期:03-10
美股行情纳斯达克实时走势图「美股周二:纳指跌近2%,热门中概股普跌,阿里跌逾4%」
4月26日消息,美国时间周二,美股收盘主要股指全线下跌,科技股领跌。投资者消化了一批喜忧参半的企业财报,以及显示美国经济放缓和消费者正承受通胀压力的数据。道琼斯指数收于335...
日期:04-26
巴黎世家推出13000元薯片包:国内还未开售已被订光!网友平替含泪省1万3
朋友,听说过薯片包吗?从字面意义上,它是薯片的包装袋,可是从时尚的角度,这是在今年巴黎世家(Balenciaga)春夏大秀上出现的一种新式包包。官方毫不避讳灵感来自乐事薯片袋”,皱巴巴看...
日期:11-16