您的位置:首页 > 互联网

百亿tokens免费额度,清华系明星AI公司的羊毛薅起来

发布时间:2024-04-01 10:15:55  来源:互联网     背景:

声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:允中,授权转载发布。

百亿token补贴,4月起免费!

这次的羊毛来自清华系AI公司无问芯穹,企业与个人皆可薅~

这家公司成立于2023年5月,目标是打造大模型软硬件一体化最佳算力解决方案。

就在刚刚,它发布了基于多芯片算力底座的无穹Infini-AI大模型开发与服务平台,供开发者体验、对比各种模型和芯片效果。

图源备注:图片由AI生成,图片授权服务商Midjourney

大模型浪潮涌起之后,有人调侃:

比起“造福人类”,大模型更应该先呼吁“给我场景”。

然而,无问芯穹认为,经历了互联网时代的高速发展,中国市场并不缺应用场景。

大模型的落地难,症结在于行业内正在持续遭遇的算力难题。

比起“给我场景”,更应该先呼吁“解决算力”。

中国互联网开始告别免费时代了

而无问芯穹正在做的,就是这么一件事。

让开发者花小成本、用好工具和充沛算力

今天,无问芯穹发布了基于多芯片算力底座的无穹Infini-AI大模型开发与服务平台。

还宣布自3月31日起,正式开放全量注册,给所有实名注册的个人和企业用户提供百亿tokens免费配额。

开发者可以在这个平台上体验、对比各种模型能力和芯片效果。

通过简单拖、拽各种参数按钮的动作,就能精调出更贴合业务的大模型,并部署在无穹Infini-AI上;再以非常优惠的千tokens单价向用户提供服务。

目前,无穹Infini-AI已支持了Baichuan2、ChatGLM2、ChatGLM3、ChatGLM3闭源模型、Llama2、Qwen、Qwen1.5系列等共20多个模型,以及AMD、壁仞、寒武纪、燧原、天数智芯、沐曦、摩尔线程、NVIDIA等10余种计算卡,支持多模型与多芯片之间的软硬件联合优化和统一部署。

第三方平台或自定义训练、微调而来的模型也可以无缝迁移托管到无穹Infini-AI,并获得细粒度定制化的按token计费方案。

“我们对模型品牌和芯片品牌的覆盖率还会持续提升,随着时间的推移,无穹Infini-AI的性价比优势会越来越突出。”无问芯穹联合创始人兼CEO夏立雪表示,未来,无穹Infini-AI还将支持更多模型与算力生态伙伴的产品上架,让更多大模型开发者能够“花小钱、用大池”,持续降低AI应用的落地成本。

一个月前,同道猎聘在部分城市发布了AI驱动的数字人面试官产品,并且还有更多的AI功能正在筹备中。

这就是由无问芯穹提供的弹性算力使用方案,并在无问芯穹的平台上基于开源大模型微调而成。

相比市面上的其他方案,实现了更高的推理加速,也大幅降低了新功能上线的成本。夏立雪表示,这一效果让无穹团队很有信心。

因此,除了开放全量注册,也正式启动了大算力需求方的测试邀请,提供更具性价比的算力、且在算法和硬件上更有纵深的算力优化服务。

那些遇到算力难题的企业

想在成熟场景中应用大模型的企业,找到了算力但不会用,无法做出差异化的产品实现业务升级。

想创造AI-Native应用的企业,算力成本难负担,工具链也不好用,产品启动投产比不合理。

苹果发布ios 16系统降级

自行训练模型的企业,随着业务的拓展,往往找不到也买不起所需体量的算力,业务运行成本过高。

截至2023年年末,我国算力总规模达到每秒1.97万亿亿次浮点运算(197E FLOPs),位居全球第二,算力规模近5年年均增速近30%。

如此增速,为何行业内仍然感到算力尤其难?

背后的原因是,AI行业发展恰逢工程师人才红利爆发,加速了我国大模型行业的蓬勃发展,需求端“嗷嗷待哺”,而市面上仍存在大量未被收集和充分利用的算力资源,缺少一种足够成体系的“大模型原生”商业模式,将算力供给转化为满足市场需求的产品和服务。

3d立体花朵贺卡

算力性价比大幅提升,源自多芯片优化实力

“市面上有很多未被激活的有效算力,硬件本身差距在快速缩小,但大家在使用时总会遇到‘生态问题’。”夏立雪说,这是因为硬件的迭代速度总是比软件更慢、价格更高,软件开发者不希望工作中出现除自身研发工作之外的其他“变量”,因而总是会倾向于直接使用有成熟生态的芯片。

无问芯穹希望帮助所有做大模型的团队“控制变量”,即在使用无问芯穹的算力服务时,用户不需要也不会感觉到底层算力的品牌差异。

成立不足一年的无问芯穹,何以能够在这么短时间内跑通多种计算卡上的性能优化?

2022年底,大模型引发社会广泛关注后,夏立雪和他的导师汪玉认为,国内整体算力水平距离国际先进还有明显差距,光靠芯片工艺提升或是多元芯片的迭代已远远不够,需要建立一个大模型生态系统,让不同模型能自动部署到不同硬件上,让各种算力得到有效利用。

一年后,无问芯穹宣布了在英伟达GPU和AMD等芯片上取得的优化效果,实现了大模型任务2-4倍的推理速度提升。

随后,AMD中国宣布与无问芯穹达成战略合作关系,双方将携手联合提高商用AI应用性能。

两年之后,无问芯穹在发布会上展示了其在10种芯片上的性能优化数据,在每张卡上都显示已取得了目前行业内最优的性能优化效果。

“我们与各个模型、芯片伙伴都建立了强信任关系,”夏立雪表示,“一方面来自于我们面向大模型的计算优化实力,另一方面无问芯穹非常注重保护伙伴的数据安全。无问芯穹会持续保持中立性,并且也不会与客户产生利益冲突,这是我们业务开展的基础。”

做“大模型原生”的加速技术栈与系统

“Transformer统一了这一轮的模型结构,并且表现出持续取得应用突破的趋势。”汪玉在开场发言中说,“从前我们在AI1.0时代做上一家公司,只能做很小一部分AI任务。今时不同往日,大模型结构统一了,依靠生态建立起来的硬件壁垒正在‘变薄’。”

得益于世界范围内正涌起的AI浪潮,以及中国市场的独特机会,无问芯穹面对的是一次巨大的技术机遇。

Transformer在设计时天然基于并行计算架构,规模越大的大模型带来的智能效果越好,使用的人越多,其所需的计算量也越大。

“无问芯穹正在做的是‘大模型原生’的加速技术栈。”无问芯穹的联合创始人兼CTO颜深根表示,大模型落地依赖算法、算力、数据,还有系统。算力决定了大模型的速度,设计优良的系统则能释放出更多硬件潜力。

无问芯穹的团队曾搭建过数万片GPU级的大规模高性能AI计算平台,具备万卡纳管能力,并基于自运营集群成功搭建了云管系统,已实现跨域多云间的统一调度。

One More Thing

“在端侧,人们则更加倾向于快速将大模型的能力落到人机交互的界面上,提升实用体验。”无问芯穹联合创始人兼首席科学家戴国浩认为,未来,凡是有算力的地方,都会有AGI级别的智能涌现。而每一个端上的智能来源,就是大模型专用处理器LPU。

大模型处理器LPU可以提升大模型在各种端侧硬件上的能效与速度。

戴国浩在发布会上向观众展示了“一张卡跑大模型”,其团队于今年1月初推出的全球首个基于FPGA的大模型处理器,通过大模型高效压缩的软硬件协同优化技术,使得LLaMA2-7B模型的FPGA部署成本从4块卡减少至1块卡,并且性价比与能效比均高于同等工艺GPU。未来,无问芯穹的端侧大模型专用处理器IP,可以被模块化地集成到各类端侧芯片中。

“从云到端,我们要将软硬件一体联合优化进行到底。大幅降低大模型在各个场景中的落地成本,让更多好用的AI能力更好、更平价地走进更多人的生活。”戴国浩宣布,无穹LPU将于2025年面世。


返回网站首页

本文评论
kimiv「迎接国内AIGC时代!Kimi连续5次扩容:10分钟接近任何领域专家水平」
快科技3月22日消息,月之暗面的Kimi火了,昨天下午,大模型应用Kimi的APP和小程序均显示无法正常使用。随后其母公司月之暗面发布说明,称自20日以来Kimi流量增加的趋势远超预期规划...
日期:03-23
机器人日益融入实体经济 多部门出台措施支持拓展应用空间(不包含机器人发展相关举措)
岳洋合 制图airpods新款h1芯片是几代李大海 知乎apple watch series 2发布时间苹果屏幕合作商   ◎记者 李雁争   最近一段时间,小米、腾讯等多家公司发布机器人新品;已有...
日期:08-16
a.i.人工智能「人工智能处于萌生自我意识的边缘?AMCS 公开信呼吁采取行动」
4月27日消息:数学意识科学协会 (AMCS) 撰写了一封公开信,呼吁大型科技公司和其他机构加速意识科学的研究。考虑到 ChatGPT、Bard、Bing Chat 和其他生成式 AI 的快速发展,该呼...
日期:04-27
马斯克身价排名「马斯克凭借2510亿美元身价登顶福布斯美国富豪榜 贝佐斯退居第二」
9月28日消息,据国外媒体报道,当地时间周二,福布斯公布了2022年度美国400富豪榜,其中马斯克以2510亿美元的身价排名第一。马斯克的净资产估计为2510亿美元,比去年多605亿美元,比亚...
日期:10-02
极致高端诠释奢华智能腕表新定义,华为首款黄金智能手表致敬非凡精神
在2023年9月25日华为秋季全场景新品发布会上,华为正式推出全新超高端品牌“ULTIMATE DESIGN非凡大师”,并发布了该品牌下首款黄金智能腕表——华为WATCH ULTIMATE DESIGN非凡...
日期:09-26
“永恒之蓝”案例复盘:空有数据力并不等于拥有战斗力
  今天,所有的网络安全企业都在讲威胁情报和安全大数据,但并不是所有公司都能将威胁情报和安全大数据转化为产品力和战斗力。事实上,两年前肆虐全球的“永恒之蓝”,已经戳破...
日期:05-27
洞洞鞋很丑「夏天必备的洞洞鞋引发关注!这双“丑”鞋一年狂赚40亿」
6月17日消息,每逢夏日,不少网友会家备个两三双洞洞鞋。洞洞鞋在大众审美里绝对算不上好看的鞋,它甚至被许多人诟病为丑鞋”。但是,这样一款鞋在年轻群体中收获了一大批忠实粉丝,...
日期:06-18
董宇辉任新东方董事长文化助理 主播升级合伙人_新东方老师董堂荣
据报道,董宇辉被任命为新东方教育科技集团董事长文化助理,同时兼任新东方文旅集团副总裁。此消息在 12 月 17 日晚 11 时左右通过东方甄选发布的直播预告海报中宣布,海报显示董...
日期:12-19
airpods pro右耳能出声但是功能全无「曝苹果AirPods Pro 2耳机存在问题:音频发声出现问题」
一早行业中爆料了苹果AirPods Pro 2无线耳机在上个月发布以来, 出现了不少BUG,具体体现在用户在听音乐时,出现了的音频漂移问题,即使在苹果的空间音频和动态头部追踪等功能被禁...
日期:10-22
微软中国员工谈裁员传闻:邮件只发给了高层_微软裁员不到1000人
(广隶)北京时间6月22日消息,据国外网络媒体报道,微软公司在内部电子邮件中提醒员工,下个月将进行重组,并裁掉部分冗员。腾讯科技从微软中国内部员工处了解到,确实听说了该消息,但非...
日期:07-30
中国移动上研院的“唐山海泰5G+工业视觉质检项目”
通信世界网消息(CWW)中国移动上研院以AI智旭-5G+光伏智能检测系统为核心,针对光伏制造工厂推出了端对端的“无人化”解决方案,该方案在唐山海泰新能科技股份有限公司得到成功应...
日期:09-28
经济日报:美国芯片法案拦不住“中国芯”!_美国阻碍无效!累计7.41万家,国产芯片成功打破西方垄断
近日,美国《芯片和科学法案》正式签署,美国拟投入500多亿美元推动芯片的研发制造和劳动力发展,给“美国芯”又加一把油。根据该法案规定,获得资金补贴的芯片企业,未来10年内将不...
日期:08-17
董宇辉带货人民文学销售额破1663万 卖出超8万套_董文宇是谁
1月23日晚,一场别开生面的直播活动在文学界掀起了热潮。《人民文学》杂志携手作家梁晓声、蔡崇达,与俞敏洪、董宇辉共同畅谈“我的文学之路”,为观众带来了一场文学的盛宴。作...
日期:01-25
坚果投影发布致智能投影行业的公开信 呼吁良性竞争_网易订阅「坚果投影是哪个公司的」
  【宅秘新闻】近日,坚果投影官方发布了《致智能投影行业的一封公开信》,呼吁每一位同行者,为中国智能投影行业共尽一份力。  在公开信中,坚果投影表示,坚果倡导共创三色激光...
日期:06-11
马斯克要求推特工程师默写代码 网友:这是要整顿美国职场?「马斯克新推特」
11月1日 消息:最近,马斯克接管推特后,公司内部发生了一系列重大变化,而CEO、CFO被解雇并不是终点。据知情人士透露,马斯克先生的团队开始与他的一些员工会面,审查Twitter的软件代...
日期:11-10
李佳琦为直播不当言论道歉:作为主播应该控制情绪
凤凰网科技讯 9月11日,针对直播间不当言论,9月11日凌晨,李佳琦微博发文,就10日晚上直播间内因网友嫌眉笔太贵回怼对方的行为道歉,他表示,自己在直播间回应产品评论时,说了不恰当、...
日期:09-11
冻梨跨界可甜可咸可烧烤 传统美食焕发新活力_冻梨饮食民俗
1月9日,黑龙江哈尔滨的食客们迎来了一次前所未有的美食体验。继经典的冻梨雕花之后,又一款创意烧烤新作亮相——冻梨雕花烧烤,成功吸引了无数人的目光。这款美食打破了传统烧烤...
日期:01-10
在“优爱腾”买会员的年轻人,还愿意为“抖音们”掏钱吗?_爱优腾联合会员怎么领取
声明:本文来自于微信公众号锌刻度(ID:znkedux),撰文/黎炫岐,编辑/李觐麟,授权转载发布。你或许已经习惯了“优爱腾芒”等长视频平台的“套娃式付费”,也为抖音、快手的微短剧付花...
日期:11-28
AI安全辩论:Sam Altman剑桥演讲遭抵制、Llama 2被曝存在潜在风险
要点:1. Sam Altman在剑桥活动中遭到抵制,引发全球AI安全讨论升级,包括联名信呼吁对人工智能制定国际条约。2. MIT的研究指出,开源的Llama2存在潜在风险,可能被滥用以获取危险知...
日期:11-02
纽交所“预摘牌”后阿里巴巴再发公告:努力保持同时双重上市(纽交所 从挂牌到正式上市)
实体店 电商苹果发布homepod比亚迪宋max易车网 查看最新行情   作者/王海   今天(8月1日)早间,阿里巴巴在港交所(09988.HK/BABA.NYSE)公告称,公司将继续留...
日期:08-02