您的位置:首页 > 互联网

让设备拥有自己的智能,岩山科技旗下岩芯数智加速端侧布局_岩心科技上市可能性

发布时间:2024-07-01 16:01:11  来源:互联网     背景:

6月,三笔巨额融资掀开大模型战事新篇章。

前脚,加拿大Cohere以50亿美元估值揽获4.5亿美元融资,英伟达、思科助力;后脚,法国Mistral AI喜提6亿欧元,General Catalyst领投;随后,日本SakanaAI也传出即将斩获超1亿美元融资,估值飚至约11.5亿美元。

春江水暖鸭先知,国际VC押注各地AI独角兽强势出圈背后,一个共性趋势随即浮现:PK OpenAI,他们正以小参数、低成本落地端侧“突围”。

Cohere开源的新一代大模型Aya23,以80亿和350亿两种参数,支持23种语言;

Mistral AI去年发布的Mistral7B,以70亿参数打败了数百亿参数的开源大语言模型霸主Llama2,另一款模型Mistral Large开发成本低于2000万欧元(约2200万美元),对比GPT-4的开发成本,更是打掉了超4/5;

再到Sakana这边,其以核心的“模型合并”技术来自动化“进化”算法,号称对算力资源的需求极小、能将数据学习周期缩短数百倍。

群雄逐鹿之下,这场AI盛宴行至2024,已然不再是一场堆算力、垒数据的“烧钱”游戏。

寻找Transformer外的可能,“天选”端模来了

身处大模型一线,近半年,刘凡平对底层技术架构的创新和突破这一趋势有着明显的直接感受。

“在全球范围内,一直以来都有不少优秀的研究者试图从根本上解决对Transformer架构的过度依赖,寻求更优的办法替代Transformer。就连Transformer的论文作者之一Llion Jones也在探索‘Transformer之后的可能’,试图用一种基于进化原理的自然启发智能方法,从不同角度创造对AI框架的再定义。”

岩心科技上市可能性

华为智慧屏v系列新品

他看到,技术变化永远走在最前面,需要时时刻刻保持“不被颠覆”的警惕,但一方面,这个80后创业者看到新技术带来新产品、新市场机遇的出现,又对行业利好倍感兴奋。

在这场对标OpenAI的竞赛中,刘凡平也早就做好了准备,其带队的RockAI亦走出了一条属于自己的进化路径。

自成立伊始,RockAI就不曾是Transformer学徒,即便是在“百模大战”打得火热的去年,刘凡平就意识到Transformer架构底层设计逻辑对训练数据量的要求极大,虽是大模型的智能体现,却难以避免“一本正经的胡说八道”的幻觉问题,包括训练的资源消耗已成行业通病。

甚至连Transformer这个架构的设计者Aidan Gomez,都对“做了很多浪费的计算”一声叹息,希望“Transformer能被某种东西所取代,将人类带到一个新的性能高原。”

可谓,成也萧何败也萧何。

但更大的挑战在于,Transformer在实际应用中的高算力和高成本,让不少中小型企业望而却步。其内部架构的复杂性,让决策过程难以解释;长序列处理困难和无法控制的幻觉问题也限制了大模型在某些关键领域和特殊场景的广泛应用。

岩心科技有限公司

在行业对于高效能、低能耗AI大模型的需求不断增长下,彼时,刘凡平就一直在思考“大模型动辄上万亿的token训练是否真的必要”,对Transformer模型不断的调研和改进过程中,更让他意识到了重新设计大模型的必要性。

以人类大脑几十亿的训练量来看,他判断,数据、算力并不是最终的瓶颈,架构、算法才是重要的影响因素,就此开启了RockAI“破坏式”自研突围。

1月,刘凡平带着国内首 个非Attention机制的通用自然语言大模型——Yan1.0模型公开露面。

当时,1.0版通过对Attention的替换,将计算复杂度降为线性,大幅降低了对算力的需求,用百亿级参数达成千亿参数大模型的性能效果——记忆能力提升3倍、训练效率提升7倍的同时,实现推理吞吐量的5倍提升。

更令人欣喜的是现场,Yan1.0模型在个人电脑端的运行推理展示,证实了其可以“原生无损”在主流消费级CPU等端侧设备上运行的实操性。

要知道,原生无损对应的反面就是有损压缩,后者是目前大模型部署到设备端的主流方式。

大热的AIPC是把Transformer架构的模型通过量化压缩部署到了个人电脑,甚至70亿参数的大模型还需要定制的PC芯片提供算力;就连Llama38B以每秒1.89个token的速度运行树莓派5,支持8K上下文窗口的战绩,也是止步于“有损压缩”。

更大的模型效果更好,但是如果不通过量化压缩是部署不到个人设备上的,恰好说明了Scaling law的局限。

同时,有损压缩如同把平铺的纸揉小后有褶皱般放入,让多模态下的性能损失无法恢复到原有状态去进行模型训练,更直接导致卡住不动、死机等不确定问题的出现,甚至三五分钟才能蹦完一句话。

“去”量化压缩这一步意味着Yan模型在设备端运行避开了多模态下的性能损失,以及具备再学习的能力,也就是说在兼容更多低算力设备上,是“天选级”端侧模型。

同步学习,让模型边跑边进化

“原生无损”部署到个人电脑,这只是Yan1.0的表现。

刘凡平还有2个疑问待解,一是能不能在更低算力、更普适的设备上部署大模型;二是部署在端侧以后,模型能不能个性化的即时学习。

而这两个问题的实现,直接带着RockAI朝着Yan2.0进发。

看到AIPC依然是云端大模型为主,离线状态下模型基本只勉强可用,而用户的个人隐私在云端模式下依然待解,刘凡平意识到要找到更低算力且可大部分时间离线使用的设备来做进入设备的“敲门砖”。

“PC或者高端手机其实模型量化都能跑,但是高端设备的GPU算力跟低端设备差距很大,所以PK得往更低端设备走,才能跟设备厂商获得谈的资格。”

于是,他的目光便落到了树莓派上。

这个袖珍型小巧却又性能强大的微型电脑,可广泛应用于物联网、工业自动化、智慧农业、新能源、智能家居等场景及设备,譬如门禁、机器人等终端,同时,大部分情况没有联网。

这就意味着,跑通树莓派,等同于打开了低算力设备端的大门以及不联网的多场景应用。

为了“拿下”树莓派,刘凡平得进一步实现Yan模型的降本增效,于是在算法侧,基于仿生神经元驱动的选择算法便出现在了眼下的Yan1.2模型上。

参考人脑的神经元大概是800-1000亿,功耗大概是20-30瓦,而一台GPU算力服务器功耗能到2000瓦,刘凡平认为主流大模型的全参数激活,本身就是不必要的大功耗浪费。

而基于仿生神经元驱动的选择算法,便是使大模型可以根据学习的类型和知识的范围分区激活,如同人开车跟写字会分别激活脑部的视觉区域和阅读区域一般,不仅可以减少数据训练量,同时也能有效发挥多模态的潜力。

据悉,在3月类脑分区激活的工作机制实现后,甚至10亿级参数的Yan模型通过改进在0压缩和0裁剪的情况下在一台7年前生产的Mac笔记本的CPU上跑通本地训练过程,5月Yan1.2模型便成功跑通树莓派。

值得注意的是,模型分区激活不仅可以降低功耗,同时还能实现部分更新,也就意味着部署后还具备持续学习能力,而这又是Transformer一众学徒的“软肋”。

众所周知,大模型的出现也带来一种开发范式:先通过预训练让大模型具备一定的基本能力,然后在下游任务中通过微调对齐,激发模型举一反三的能力。

这就类似先花大量的时间和资源把1岁孩子封闭式培养到成为大学生,然后在不同的工作场景里进行锻炼对齐。

这种范式统一了以往处理不同自然语言任务需要训练不同模型的问题,但也限制了模型在不同场景的应用。

如果换一个没有经过预训练的工作场景,一切都要从头再来,两个字概括:麻烦。

一个离自主进化遥远的Transformer大模型,反映到现有实践中,那就是一旦内容变化,往往要1-2个月去把数据清掉后,再重新训练后进行提交。

预训练完之后再大规模反向更新,无论从算力、时间还是经济成本,对企业而言“难以接受”,也让刘凡平在低消耗、显存受限的情况下,为实现端侧训推同步,在模型分区可部分激活更新下,持续寻找反向传播的更优解,试验能更低代价更新神经网络的方案。

从反向传播对参数的调节过程来看,只要模型调整足够快、代价足够小,就能更快达到预期,实现从感知到认知再到决策这一循环的加速,对现有知识体系进行快速更新。

如此一来,通过模型分区激活+寻找反向传播更优解“两步走”,就能实现模型的边跑边进化,“同步学习”的概念在RockAI逐步清晰。

寻找设备端的智能,谁能成为具身“大脑”?

如上,把一个训练完的Transformer大模型比作大学生,那么,一个可同步学习的Yan模型,在刘凡平看来,就是一个正在咿呀学语的孩子。

“从小在各种环境下学习,建立知识体系,又不断推翻重建,每一天都有新的体悟,会成独有的知识体系,最终个体多样性会带来群体智慧和分工协作。”

而这样个性化的端侧模型有多重要呢?可以设想:在一个智能城市中,每个家庭的智能家居系统都具备了Yan模型这样的能力。这些系统可以根据每个家庭成员的习惯、喜好以及环境变化进行自主学习,并做出相应的调整,个性化服务身边的每一个人。

在刘凡平的设想中,智能“大脑”,关键在于实现模型在边缘计算中的持续学习能力和适应能力。具备同步学习能力的Yan2.0模型部署到手机、电脑,甚至电视、音响等各类设备后,会根据你说的话和场景进行自主学习,判断出你喜欢的事情,通过跟用户对齐,越来越具备个性化价值,最终形成可交互的多样性智能生态。

不过,刘凡平也坦言,相较于B端,目前设备端依然是大模型的蓝海市场,离终 极的个性化AI还差一步。

但这,也给了具备低成本低算力基因的RockAI,从“为设备而生”到“为设备而用”抢占先机的可能。

Yan2.0会在年底或明年初面世, 在他看来,这些设备前期的适配工作做足至关重要,现阶段是系统适配各种硬件,端侧模型需要结合实际载体(即硬件)去做适配研究和迭代改进。

在树莓派跑通后,很多机器人厂商也找到了刘凡平,从某种意义上来说,他们也在寻找具身大脑的可能,一家教育机器人公司甚至给到了刘凡平“愿意第 一时间集成Yan2.0”的回复。

对于具身智能这一爆火命题,刘凡平很坦率,从身到脑都需要搅局者,但他也有“野心”,去成为那个破局人:在技术创新、商业化同步发力。

四个月前,在Yan架构的发布会上,他曾提出了打造“全模态实时人机交互系统”的理念,期望Yan模型未来向全模态、实时人机交互、训推同步的方向持续升级,使AI技术更加易于获取和使用,推动普惠人工智能的发展。

而如今,随着Yan2.0将逐步把多模态的视觉、触觉和听觉能力补齐,并结合同步学习的能力,一个在感知、认知、决策、行动四个方面得到全面提升的机器人似乎也在具象化。

可以预见:在感知方面更多模态输入后,机器人同时拥有眼睛和耳朵,可以实时看到和听到信息,然后把接受到的信息进行认知理解,随着理解加深,能做出对应的有倾向性的、个性化的判断,并支配四肢行动。

一个大模型在更加便携的设备或终端中进行无损部署的蓝图,正在徐徐展开。


返回网站首页

本文评论
无需再依赖美国GPS 日本计划拓展本土Michibiki卫星定位网络
 5 月 8 日消息,日本太空政策委员会决定扩大其 Michibiki 准天顶卫星系统(Michibiki - Quasi-Zenith Satellite System),这是一个在日本和澳大利亚上空的地球同步轨道上运行的...
日期:09-29
一夜淘汰700人!ChatGPT之母:AI自动化取代人类,创意性工作可能消失
声明:本文来自于微信公众号 新智元(ID:AI_era),作者:桃子 乔杨,授权转载发布。【新智元导读】AI淘汰大部分人类似乎就是一场终局。OpenAI CTO在采访中称,一些创意性的工作会消失...
日期:06-24
钉钉、飞书肉搏AI,压力给到企业微信_企业微信钉钉飞书功能对比
声明:本文来自于微信公众号 蓝洞商业(ID:value_creation),作者:赵卫卫,授权转载发布。商店里有一些极其有用的GPT,但可能一切都是二次元老婆(everything is waifus)会成为最受欢迎...
日期:01-15
抖音电商:过去一年优质内容创作者增长484%「抖音热门作品持续了一个月」
2月8日消息,抖音电商披露最新数据,截至去年10月,抖音电商优质内容创作者数量较年初增长484%;平台挖掘优质短视频超147万条,助力超26万名创作者人均流量增长56%,GMV提升5%-10%。抖...
日期:02-08
武汉最新发热门诊就诊流程_动一动手查询周边发热门诊信息 为抵抗武汉疫情做充足准备
  2020年大年初二,新一年里“云拜年”的第二天,新型冠状病毒感染所致肺炎的疫情继续牵动全国人的心。在全国各地的迅速响应下,一场与病毒的斗争已全面展开。医护人员“逆行...
日期:05-04
iPhone14还没捂热,15系列三大升级曝光,值得再等一年「iPhone13真机曝光,这6大升级已确认」
从9月16日iPhone14首销到今天,不少用户都已经用上了机器,随之而来的是对灵动岛设计的吐槽,对手机发热量大的质疑等。而当很多人还没捂热iPhone14的时候,网上又传来了iPhone15系...
日期:09-29
三星s24概念机「安卓新标杆官宣!三星Galaxy S24系列1月18日发布,效仿国产机发力AI」
  科客点评:设计美学方面三星Galaxy S24系列预计没啥惊喜,但愿全新的Galaxy AI能够争气一些吧。  1月4日,有不少网友反馈收到三星电子推送短信,预热1月18日凌晨2时的Galaxy...
日期:01-04
蔚来汽车 加班「是员工自愿加班 蔚来员工曝加班近500小时进急诊3次-HR」
近日,一位蔚来汽车的员工爆料称,近半年来业务量大幅增长,导致加班情况愈加严重。该员工提供的加班记录文档显示已加班近500小时。该员工名叫陈女士,她表示自己负责产品运营,平时...
日期:10-01
真我gtneo6发布会直播“性能飓风”来袭 真我GT-Neo6发布会邀请函
来源:中关村在线中关村在线消息:今日真我 realme 副总裁、全球营销总裁、中国区总裁徐起官宣,真我新品发布会定档 5 月 9 日下午 2 点,并表示此次发布会是“机圈首场 A...
日期:05-07
创新工场被指抄袭:点点是最大样本
  多个项目中闪现硅谷等地互联网企业的原型,创新工场及其创始人李开复陷入“山寨”质疑。   之前甚至有网友制作了一个名为“抄袭工场”的网站,其使用了创新工场主页的主...
日期:07-27
教学减负  希沃班级优化大师让打卡变得简单_希沃班级优化大师心得
  提起打卡,老师和家长可能会觉得头疼。   学校布置的日常任务由家长、老师共同监督,以手机打卡的方式进行。以下场景,您是否也遇到过?   尝试让家长在微信群发起打卡...
日期:02-03
小米SU7最新OTA计划公布:5月两拨推送 城市领航开通10城_miui7介绍
快科技4月25日消息,今天在北京车展上,雷军公布了小米SU7的最新OTA计划。小米SU7计划在5月初进行第一次OTA,新增支持无线CarPlay;5月底计划第二次OTA,城市NOA开通10城。雷军表示,小...
日期:04-25
扎克伯格与黄仁勋罕见同框:拍下互换外套有趣瞬间_扎克伯格帅
科技界再掀波澜,Meta首席执行官马克・扎克伯格与英伟达CEO黄仁勋在周二的一次罕见同框中,引发了广泛热议。这一热议的焦点,正是他们互换外套的有趣瞬间。在Instagram上,扎克伯格...
日期:03-28
星巴克也不过如此「当星巴克褪去“光环” 也到了需要求变的时候了」
声明:本文来自于微信公众号 全天候科技(ID:iawtmt),作者:胡描,授权转载发布。从2011年到2022年,星巴克在中国的门店数量从400家,增长到了超过6000家,中国区域也成为了星巴克仅次于美国...
日期:11-13
苹果iphone_苹果iphone15最新消息
苹果公司推出的iPhone,是集通信、娱乐、办公三位一体的全球智能手机领导者。iPhone的出现对手机市场产生了极大的冲击,创新的设计和强大的功能使得iPhone成为人们热捧的手机品...
日期:05-31
育碧官宣:《阿凡达:潘多拉边境》开发完毕 12月7日正式发售_阿凡达:创建潘多拉世界 电影
快科技11月14日消息,今天育碧官方宣布《阿凡达:潘多拉边境》现已开发完毕,正式进入压盘阶段,并表示该游戏将于今年12月7日准时发售。速腾聚创上市公司同时官方还在推文中赞扬了...
日期:11-14
Meta AI 负责人:当前的 ChatGPT 等人工智能还不如狗聪明
6月16日消息:当前的人工智能系统(如 ChatGPT)并没有人类级别的智能,甚至不如狗聪明。这是 Meta 的 AI 负责人在关于这种快速发展技术危险的论坛中表示的。ChatGPT 是由 OpenAI...
日期:06-16
台积电芯片供应「AI芯片需求强劲,台积电第一季度利润预计增长5%」
划重点:网络靶场建设小米笔记本air13 2018⭐ TSMC 预计第一季度净利润将增长5%,受益于强劲需求⭐ AI 芯片需求推动 TSMC 第一季度营收大幅增长,超出市场预期⭐ TSMC 宣布在亚...
日期:04-16
欧洲通信卫星公司OneWeb 首次获得印度空间监管机构对卫星宽带服务的批准
11月21日,OneWeb India公司获得了印度国家空间促进和授权中心(IN SPACe)的授权,将在印度提供欧洲通信卫星组织OneWeb的商业卫星宽带服务。OneWeb India公司是第一个获得这一授...
日期:11-29
Youtube订阅_YouTube计划推出流媒体视频在线商店服务
8月15日消息,据报道,近日,Alphabet旗下YouTube正计划推出其流媒体视频在线商店服务。   知情人士称,YouTube已重新与娱乐公司就参与该平台进行谈判,这一平台在YouTube被称为“...
日期:08-17