您的位置:首页 > 互联网

图领域首个通用框架来了!入选ICLR'24 Spotlight,任意数据集、分类问题都可搞定|来自华盛顿大学&北大&京东

发布时间:2024-02-06 18:11:41  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:丰色,授权转载发布。

苹果12要买延保吗

能不能有一种通用的图模型——

它既能够根据分子结构预测毒性,又能够给出社交网络的朋友推荐?

或者既能预测不同作者的论文引用,还可以发现基因网络中的人类衰老机制?

你还真别说,被ICLR2024接收为Spotlight的“One for All(OFA)”框架就实现了这个“精髓”。

它由圣路易斯华盛顿大学陈一昕教授团队、北京大学张牧涵以及京东研究院陶大程等研究者们联合提出。

作为图领域首个通用框架,OFA实现了训练单一GNN模型即可解决图领域内任意数据集、任意任务类型、任意场景的分类任务。

具体如何实现,以下为作者投稿。

图领域通用模型设计面临三大难

设计一个通用的基础模型来解决多种任务是人工智能领域的一个长期目标。近年来,基础大语言模型(LLMs)在处理自然语言任务方面表现出色。

然而,在图领域,虽然图神经网络(GNNs)在不同的图数据中都有着不俗的表现,但如何设计与训练一个能同时处理多种图任务的基础图模型依然前路茫茫。

与自然语言领域相比,图领域的通用模型设计面临着许多独有的困难。

首先,区别于自然语言,不同的图数据有着截然不同的属性与分布。

比如分子图描述了多个原子如何通过不同的作用力关系形成不同的化学物质。而引用关系图则描述了文章与文章之间相互引用的关系网。

这些不同的图数据很难被统一在一个训练框架下。

其次,不同于LLMs中所有任务都可以被转化成统一的下文生成任务,图任务包含了多种子任务,比如节点任务,链路任务,全图任务等。

不同的子任务通常需要不同的任务表示形式与不同的图模型。

最后,大语言模型的成功离不开通过提示范式而实现的上下文学习(in-context learning)。

在大语言模型中,提示范式通常为对于下游任务的可读文字描述。

但是对于非结构化且难以用语言描述的图数据,如何设计有效的图提示范式来实现in-context learning依然是个未解之谜。

用“文本图”概念等来解决

下图给出了OFA的整体框架:

具体而言,OFA的团队通过巧妙的设计来解决上述所提到的三个主要问题。

对于不同图数据属性与分布不同的问题,OFA通过提出文本图(Text-Attributed Graph, TAGs)的概念来统一所有图数据。利用文本图,OFA将所有的图数据中的节点信息与边信息用统一的自然语言框架来描述,具体如下图所示:

接着,OFA通过单一LLM模型对所有数据中的文本进行表示学习得到其嵌入向量。

这些嵌入向量将作为图模型的输入特征。这样,来自不同领域的图数据将被映射到相同的特征空间,使得训练一个统一的GNN模型可行。

OFA收集了9个来自不同领域,不同规模的图数据集,包括引用关系图,Web链接图,知识图谱,分子图, 如下图所示:

此外,OFA提出Nodes-of-Interest(NOI)子图与NOI提示节点(NOI Prompt Node)来统一图领域内不同的子任务类型。这里NOI代表参与到相应任务的一组目标节点。

比如,在节点预测任务中,NOI是指需要预测的单个节点;而在链路任务中,NOI包括需要预测链路的两个节点。NOI子图是指围绕着这些NOI节点扩展出的一个包含h-hop邻域的子图。

然后,NOI提示节点为一个新引入的节点类型,直接连接到所有的NOI上。

重要的是,每个NOI提示节点包含了当前任务的描述信息,这些信息以自然语言的形式存在,并和文本图被同一个LLM所表示。

由于NOI中节点所包含的信息在经过GNNs的消息传递后将被NOI提示节点所收集,GNN模型仅需通过NOI提示节点来进行预测。

这样,所有不同的任务类型将拥有统一的任务表示。具体实例如下图所示:

最后,为了实现图领域的in-context learning,OFA引入统一的提示子图。

在一个有监督的k-way分类任务场景下,这个提示子图包含了两类节点:一类是上文提到的NOI提示节点,另一类是代表k个不同类别的类别节点(Class Node)。

每个类别节点的文本将描述此类别的相关信息。

NOI提示节点将会单向连接到所有类别节点上。通过这个方式构建好的图将被输入进图神经网路模型进行消息传递与学习。

最终,OFA将对每个类别节点分别进行二分类任务,并取概率最高的类别节点作为最终的预测结果。

由于类别信息存在于提示子图中,即使遇到全新的分类问题,OFA通过构建相应的提示子图即可直接进行预测而无需任何微调,从而实现了零样本学习。

对于少样本学习场景,一个分类任务将包含一个query输入图和多个support输入图,OFA的提示图范式会将每个support输入图的NOI提示节点与其所对应的类别节点相连,同时将query输入图的NOI提示节点与所有类别节点相连。

后续的预测步骤与上文所述一致。这样每个类别节点将会额外得到support输入图的信息,从而在统一的范式下实现少样本学习。

OFA的主要贡献总结如下:

tcl乐玩2c

统一的图数据分布:通过提出文本图并用LLM转化文本信息,OFA实现了图数据的分布对齐与统一。

统一的图任务形式:通过NOI子图与NOI提示节点,OFA实现了多种图领域子任务的统一表示。

统一的图提示范式:通过提出新颖的图提示范式,OFA实现了图领域内的多场景in-context learning。

超强泛化能力

文章在所收集的9个数据集上对OFA框架进行了测试,这些测试覆盖了在有监督学习场景下的十种不同任务,包括节点预测、链路预测和图分类。

实验的目的是验证单一的OFA模型处理多任务的能力,其中作者对比使用不同LLM(OFA-{LLM})和每个任务训练单独模型(OFA-ind-{LLM})的效果。

比较结果如下表所示:

可以看到,基于OFA强大的泛化能力,一个单独的图模型(OFA-st,OFA-e5,OFA-llama2-7b,OFA-llama2-13b)即能够在所有的任务上都具有与传统的单独训练模型(GCN, GAT, OFA-ind-st)相近或更好的表现。

同时,使用更强大的LLM可以带来一定的性能提升。文章进一步绘制了训练完成的OFA模型对于不同任务的NOI提示节点的表示。

可以看到不同的任务被模型嵌入到不同的子空间,从而使得OFA可以对于不同的任务进行分别的学习而不会相互影响。

在少样本以及零样本的场景下,OFA在ogbn-arxiv(引用关系图),FB15K237(知识图谱)以及Chemble(分子图)上使用单一模型进行预训练,并测试其在不同下游任务及数据集上的表现。结果如下:

可以看到,即使在零样本场景下,OFA依旧可以取得不错的效果。综合来看,实验结果很好的验证了OFA强大的通用性能以及其作为图领域基础模型的潜力。

更多研究细节,可参考原论文。

地址:

https://arxiv.org/abs/2310.00149

https://github.com/LechengKong/OneForAll

—完—


返回网站首页

本文评论
苹果 macOS Big Sur / Catalina 的 Safari 15.6.1 正式版发布,修复严重漏洞「mac big sur11.5.1」
  8 月 21 日消息,苹果本周发布了 iOS 15.6.1 和 macOS Monterey 12.5.1 正式版,两者都具有安全增强功能。为了将这些安全增强功能带给更多用户,苹果发布了适用于运行 macO...
日期:09-07
OpenAI TTS体验入口地址 AI文字转语音软件推荐_tts文字转语音模块
OpenAI TTS 是一款文字转语音(TTS)软件,能够将文本转换为逼真的人声。它采用了先进的人工智能技术,能够生成高质量的语音,并支持多种语言。OpenAI TTS的体验入口在哪呢,这里我们来...
日期:01-05
已在 40 多个国家和地区上线,OpenAI将在更多市场推出官方版ChatGPT
5 月 26 日消息,OpenAI 宣布已经在 40 多个国家和地区,推出了适用于 iPhone 和 iPad 的官方 ChatGPT 应用程序。官方版 ChatGPT 于上周率先在美国市场推出,OpenAI 承诺未来...
日期:05-26
大力教育年度数据公布 “空中课堂”累计完成29.6亿分钟课程_大力教育极课大数据
  近日, 大力教育发布2020年度数据,用最直观的数字呈现出科技创新对教育的贡献。   疫情期间,清北网校帮助近千所中小学免费搭建了直播系统,支持了全国中小学的“停课不停...
日期:07-16
周鸿祎直播演示360智脑高考作文 冯仑:及格 但不打动人「360总裁周鸿祎讲座」
6月8日消息,昨晚,360集团创始人周鸿祎和御风集团董事长、万通集团创始人冯仑展开了一场直播对话。对话中,周鸿祎演示了自家360智脑写作“人·技术·时间”为主题的高考作文,冯仑...
日期:06-08
Akamai三步走,打造三位一体的云战略格局
通信世界网消息(CWW)从1998年发明CDN技术并成立公司至今,Akamai走过了26年的历程。26年来,信息通信技术日新月异,产业格局变化翻天覆地,而Akamai一直与时俱进、稳健成长,如今形成了...
日期:02-06
华为Mate60 Pro 正式开售:1000元订金预售,超1TB内存可选「华为mate60多少钱」
华为官方网站近日正式上架了华为Mate60 Pro+,这款手机现已支持1000元订金预售,提供16GB+512GB和16GB+1TB两种版本。同时,华为Mate60 Pro+的核心配置信息也已全面公布。在影像系统方...
日期:09-08
迪士尼第四财季营收147亿美元超预期  股价盘后涨超3%(迪士尼公司财报)
11月13日 消息:迪士尼发布四财季财报称,该公司第四财季营收147.1亿美元,超市场预期。财报发布后,迪士尼股价盘后涨超3%,报价140美元,目前,该公司市值为2448.93亿美元。财报数据显...
日期:08-01
中国口腔护理品牌_国货之光!全面口腔护理品牌获人民日报等多家央媒认可
  近日,《人民日报》点赞了全面口腔护理品牌usmile在国内口腔护理教育上的突出表现,报道一发出,迅速吸引了人民网、中国网、中华网、中国青年网等媒体的广泛关注。   ...
日期:12-02
预售价25.99万元起!极越01六小时订单达9856台_极越5w30全合成机油怎么样
快科技9月20日消息,日前,我们从极越官方获悉,旗下首款车型极越01六小时订单达成9856台。今年10月份正式上市。8k电视机销量排行榜前十名9月19日,极越01首批量产车在吉利杭州湾智...
日期:09-20
台风求生「疑台风刮来遍地生蚝 广东居民捡200斤:画面震撼 网友羡慕」
5月30日,广东汕尾,据附近居民庄先生称:以往只要刮台风就有这个现象,当时挺多人捡拾生蚝的,很大一片都是。2020 q4手机销量庄先生和朋友两个人花了一小时收获两百多斤,觉得挺高兴的...
日期:05-30
谷歌 Pixel 8 / Pro 手机售价曝光:699 美元 / 899 美元起售_谷歌手机pixel5价格
IT之家 9 月 25 日消息,博主 kamila 昨晚在 X 平台(原推特)上放出了谷歌 Pixel 8 系列手机的详细配置清单和售价信息。这张图拥有“Pixel for Business”的抬头,上面显示 Pixel...
日期:09-25
深夜举吊瓶赶地铁的女生发声 确实是有重要的事,大家千万别模仿
5月28日,一名女子在上海地铁站内右肩挎着包,高举着吊瓶,吊瓶内还剩下一半的药液,这一画面被网友拍摄并上传至网络,引起了广泛关注。网易严选拼团是真的吗据报道,拍摄此视频的熊先...
日期:05-31
李彦宏回北大当“助教” 遭遇百度黑同学提问他如何回应?
  如果你被采访时,遇到所谓的“黑粉”,向你提问犀利问题,你会如何面对?百度创始人、董事长兼CEO李彦宏曾受张维迎教授的邀请,以特邀嘉宾的身份来到北大,面对自称“度黑”的校...
日期:01-06
北京将核发“京C”摩托车号牌:快递等电动三轮车专用 老头乐禁止
快科技8月19日消息,北京市公安局、交通委、市场监管局、商务局、城市管理委、园林绿化局、邮政管理局七部门近日联合发布《关于加强行业使用电动三轮车通行管理的通告》。其...
日期:08-19
掌趣 游戏「掌趣科技:AI游戏创作平台还在加紧开发过程中」
12月19日 消息:掌趣科技在12月18日的互动平台上宣布,公司已与北京悠米互动娱乐科技有限公司达成业务合作,共同开发AI游戏创作平台。该平台旨在降低开放世界游戏的开发门槛,让个...
日期:12-19
中国移动携手中兴通讯及是德科技完成国内首次运营商NR-NTN低轨卫星宽带业务实验室验证
通信世界网消息(CWW)近日,中国移动研究院携手中兴通讯、是德科技共同完成了NR-NTN低轨卫星实验室验证,通过终端仿真和信道仿真的实验室环境来模拟卫星通信,支持手机卫星宽带业务,...
日期:09-11
仁宝PivoBook笔记本获得IF设计奖:屏幕可旋转至“竖屏”
  2月6日消息 根据NoteBookCheck的报道,仁宝推出了PivoBook,这是一款全新的创新笔记本电脑,屏幕搭载特殊铰链,可调节方向,目前已经获得IF设计奖。   ▲图自仁宝官网   据...
日期:01-01
opporeno10倍焦距版参数「有长焦才是好人像 OPPO Reno10 系列今日开售」
6月1日上午10点,OPPO Reno10 系列正式开售,3款机型起售价分别为2499元、3499元以及3899元。该系列贯彻了Reno系列注重人像摄影的产品概念, 均配备了潜望长焦镜头,以提供更大的构...
日期:06-02
进击的闲鱼:牵手微信,开线下商店_闲鱼网开通需要微信有2000元
声明:本文来自于微信公众号 刺猬公社(ID:ciweigongshe),作者: 弋 曈,授权转载发布。2024年年初,一向以佛系著称的闲置交易平台闲鱼新动作频频。先是与微信互联互通,开通微信支付,马...
日期:02-04