您的位置:首页 > 互联网

中国电信星辰AI大模型全面开源的意义及策略建议

发布时间:2024-01-17 20:53:49  来源:互联网     背景:

国内AI大模型开源情况对标分析

2023年以来,在ChatGPT爆火的带动下,我国大模型产业迎来了一波发展高潮。2023年2月Meta开源大模型LLaMA后,全球头部厂商和创业公司纷纷加入开源浪潮中,智谱AI、阿里巴巴、百川智能等国内企业相继发布开源大模型,大模型未来竞争格局正在发生变化。截至目前不完全统计,国内对外宣布开源的各类大模型数量已达15个,如表1所示。

表1 国内已发布开源大模型情况统计

 1.  国内开源大模型类型分为5种,以大语言、多模态模型为主 

目前国内开源大模型包括大语言模型、多模态大模型、向量大模型、编程大模型和AI Agent框架/模型等5类,总体来看以大语言模型及多模态大模型为主。其中智谱AI、阿里巴巴的开源大模型均开源了4种大模型,其它大多数企业或者机构开源的模型都是1-2类左右。

 2. 国内开源大模型参数规模以60-70亿为主,最高超过千亿参数 

目前国内模型开源的参数规模分为五类:7B、13B、34B、65B、100B。国内大多数的开源大模型的参数量基本都在60-70亿参数范围。目前国产开源大模型的最高参数规模为浪潮信息的“源2.0”大模型,最大参数规模为102B,达到千亿级,赶超Meta的开源大模型LLaMA2的700亿参数。

 3. 从开源成熟度来看,国内大模型开源训练数据及细节的占比较少 

中国信通院云计算开源产业联盟发布的《可信开源人工智能大模型案例汇编》中指出,模型框架、模型代码、模型参数、训练数据四个方面是衡量其开源成熟度的重要评定等级。入选案例汇编的开源大模型中,仅有22% 的大模型对其训练数据进行开源,方便用户对模型进行微调和二次开发,其中仅有部分大模型对外公布其训练细节,方便用户研究大模型训练过程以及进行模型继续训练。

大模型开源将成为大模型产业发展的关键变量,加速产业进程

模型开源将推动实现大模型产业发展的供给侧、需求侧双向发力,对大模型基础设施运营、技术迭代创新、开放生态建设带来积极影响,将加速推动大模型产业化应用,助力产业升级:

 1. 从企业需求侧来看,开源大模型更有利于企业定制化并保障数据隐私 

相比闭源模型的“黑盒”开发,开源大模型允许企业开发人员在模型的基础上针对个性场景进行深度的定制开发,定向训练数据,也可以针对某些主题进行过滤,减少模型体量和数据的训练成本。如基于6B-7B的小尺寸开源大模型,能够让模型更快试水、验证,并进行应用开发。此外大模型的开源使得企业可以将自己的数据集在大模型上进行训练,同时做到对数据的控制,保护企业数据隐私。

 2. 从模型供给侧来看,大模型开源有利于大模型提供商加速技术迭代与创新 

开源大模型鼓励全球开发者社区的参与和贡献,这种集体智慧能够加速技术的迭代和创新,据不完全统计,LLaMA2开源后,国内就涌现出了10余个开源行业大模型。此外开源代码使用户能够审查模型的工作原理和决策过程,从而提高大模型的透明度和可信赖性。

 3. 从算力供给侧来看,大模型开源将为算力运营商带来巨大的市场机遇 

算力总需求=场景数*单场景算力需求*用户数。虽然开源大模型节省了企业训练阶段的算力消耗,但据统计达到一定用户量级的应用,推理阶段的算力消耗为训练阶段的5-10倍。大模型开源以及其背后的开放生态,将带来广泛渗透的多场景大模型应用以及更大的算力消耗,为算力运营商培育“模型越强、应用越多、用户越广、算力越大”的市场飞轮。

星辰AI大模型开源立足于国资央企新使命新定位

中国电信作为具备AI研发能力与智算服务能力的大模型领域央企主力军,此次星辰AI大模型的开源具有重要意义。通过持续开源基础大模型,将广泛地赋能更多的用户场景加速应用落地,联合各类合作伙伴打造大模型信创产业体系,是中国电信立足于新时代新征程国资央企新使命新定位,在新发展格局中发挥科技创新、产业控制、安全支撑作用的重要成果。

1. 基于开源大模型社区生态,促进国资央企特色场景应用落地

星辰AI大模型目前拥有超过 20GB 主流意识形态数据,在企业经营分析、政务、公文写作等应用场景相比其他大语言模型具备差异化竞争力,未来可基于开源大模型社区生态,一方面加速插件、Prompt、AI应用等生态繁荣,培育星辰AI大模型在通用场景的公众用户数量与活跃度,另一方面促进星辰AI大模型在政务、医保等国资央企特色场景的行业应用落地。

 2. 围绕开源大模型打造开放产业生态,打造大模型信创产业体系 

星辰AI大模型目前支持基于昇腾的Atlas 300I Pro推理卡运行推理任务,未来将以此为契机通过开源模型打造开放产业生态,吸引更多国产算力卡、模型框架、数据库、应用平台与行业软件等合作伙伴加入,共同打造大模型生态信创体系,夯实央企大模型主力军作用,发挥产业控制作用,维护网信安全的使命责任。

apus李涛百度

星辰开源大模型发展策略建议

 1. 持续提升模型能力,拓展开源大模型类型多样性 

持续迭代开源大模型,不断提升模型规模和数据规模,控制模型训练、推理精度,坚持“模型开源-社区反馈-技术优化”的正向循环,最大程度提升模型研发效能,实现在自然语言理解、知识、代码、数学、推理等12个测评中超越Llama2-13B等主流开源模型的突破;拓展开源大模型的类型多样性,如多模态大模型、编程大模型、向量大模型、Agent大模型等,打造星辰开源大模型矩阵,持续探索大模型具身智能,支持智能感知认知决策等能力。

apple watch s7芯片

 2. 提供数据与算力扶持,加快开源大模型行业应用落地 

短期来看,跟踪基于星辰AI开源大模型为基座进行二次开发的行业大模型、领域大模型项目,如果在Gitee、Github社区获得较高星级与关注度,可给予一定的数据与算力资源支持,共同推进有影响力的行业应用落地;长期来看,对标阿里魔搭ModelScope构建星辰AI开源社区,凝聚优秀开发者加入,共享模型、参数、数据集等,针对多个细分领域沉淀专业数据集及细分领域模型,应用于长尾细分场景应用落地。

 3. 加强开源配套设施建设,构建大模型技术开源体系 

一方面加强开源数据平台、大模型开发工具、大模型训练部署平台与向量数据库等基础配套设施建设,另一方面围绕微服务框架开源项目、AIGC应用开源项目、数据工具开源项目、评测开源系统等构建星辰AI大模型技术开源体系,降低AI大模型使用门槛,加速基础大模型技术迭代创新与应用落地,持续繁荣星辰开源大模型生态。

rtx3070ti显卡是中端还是高端


返回网站首页

本文评论
京东6月1日开门红「京东618开门红战报:近五成中小商家成交额增长超200%」
6月1日消息,5月31日晚8点,京东618正式开启,美的、海尔、小米、格力、Apple等品牌瞬间破亿,10分钟破亿的品牌数量同比增加了23%,超六成的新商家5分钟成交额突破五月日均全天,近五成...
日期:06-01
Midjourney生成能力惊人 但研究发现它并不理解自己生成的东西
要点:1. 生成式 AI 模型如GPT-4具有强大的生成能力,但在理解生成内容方面存在挑战,引发了一个生成式 AI 悖论。2. 最新研究指出,生成模型的生成能力往往超越了理解能力,与人类的...
日期:11-06
小米5G手机入网:支持45W快充_小米55瓦无线快充
  (原标题:小米5G手机通过3C认证:支持45W快充)   8月6日消息 昨天,小米一款5G手机通过了3C认证,最高支持45W快充。   根据认证信息,这款小米5G手机于2019年8月5日通过认...
日期:10-13
腾讯参股美团了吗「腾讯向股东派发9.58亿股美团股票,腾讯总裁刘炽平卸任美团董事」
2022年11月16日消息,腾讯控股公告显示,将按合资格股东持有每10股股份获发1股美团B类普通股的基准,向于记录日期名列本公司股东名册上股东按彼等当时各自于本公司之持股比例,以实...
日期:11-19
三星即将宣布3nm以下工艺路线图 挑战硅基半导体极限(硅的极限工艺3nm)
  在半导体晶圆代工市场上,台积电TSMC是全球一哥,一家就占据了全球50%以上的份额,而且率先量产7nm等先进工艺,官方表示该工艺领先友商一年时间,明年就会量产5nm工艺。在台积电...
日期:05-10
华为、中信科等7家中标中国移动城区及农村基站天线产品集采「中国电信基站天线集中采购项目」
2023/6/1 15:23 华为、中信科等7家中标中国移动城区及农村基站天线产品集采  焦焦 C114讯 6月1日消息(焦焦)从中国移动官网获悉,中国移动今日公示了2023年至2024年城区及...
日期:06-01
超2000万场观的线上招聘会,20倍爆发出现在意想不到的地方
声明:本文来自于微信公众号 天下网商(ID:txws_txws),作者:刘雨锟,授权转载发布。1月12日中午,徐阳正在开会。突然间桌上的手机开始持续震动,两部新买的iPhone14双双卡死。手机没坏...
日期:01-18
女生地摊套玩具熊拆开发现摄像头 还连着电池和内存卡_玩具熊监控
3月23日,一名湖南女性向媒体报告,她购买了一只玩具熊送给小侄女,结果发现该熊内部藏有一个摄像头,引发了她的担忧。该女性名叫何女士,她说小侄女玩具熊时,发现熊眼一直闪红光,这让...
日期:03-24
欧洲电视歌唱大赛指定利物浦为2023年主办城市「足球赛在英国的首都哪里举行」
欧洲广播联盟(EBU)和英国广播公司(BBC)宣布,经过激烈的竞标,利物浦被选为第67届欧洲电视歌唱大赛的主办城市。披头士乐队的故乡将代表乌克兰主办第67届欧洲电视歌唱大赛。2023年...
日期:10-08
雷军自曝MBTI是社恐型e人:真不是社牛 每次上台练习很久「雷军mba」
快科技8月10日消息,8月14日(下周一)就是雷军的年度演讲了,在演讲前,雷军发布独家预告自曝了最近很流行的MBTI测试结果。E人一定都是外向的?还真不一定。雷军表示,自己的MBTI是E型E...
日期:08-10
微博发布50万粉丝以上自媒体账号实名通知:不实名影响流量、广告分成
快科技12月22日消息,有多位微博大V分享的图片显示,微博已经向其发布了自媒体”账号前台实名信息填写通知。其中表示,根据相关政策要求,现全网各平台50万粉丝以上的自媒体”账号...
日期:12-23
撬动千亿市场,游戏底层公链SOG在发烫
  什么是SOG?   时至今日,游戏行业发展逐渐达到瓶颈期,目前传统游戏领域频繁出现暗箱操作、游戏核心数值被暗箱操作、玩家公平性被剥夺。针对传统游戏领域的痛点,Soul Gam...
日期:12-14
小米驶入汽车战场,雷军有多少胜算?_雷军的小米汽车
  小米汽车可能拥有一定规模的潜在受众群体,但其很难复制小米手机通过线上渠道快速起量的成功。  伍洋宇 来源:界面新闻  界面新闻记者 | 伍洋宇  界面新闻编辑 | 宋...
日期:12-29
校友捐书「校友承诺捐赠1100万元却不兑现被告 母校该不该讨要引热议」
承诺捐款1000万元,学校也为他举办了盛大的感谢仪式,但是捐款的钱迟迟不到位,最终被母校告上了法庭,此事近日也引起网友关注热议。据悉,2019年4月,中国矿业大学迎来110周年校庆,公开...
日期:03-09
大数据时代下的隐私安全_网易订阅「大数据时代下个人隐私」
社交媒体共享信息的便利以及依托于数据的人工智能同时引发了一种忧虑:用户们想弄明白社交媒体“巨头们”究竟知道多少关于自己的事情,而这些信息又被用在何处。2018年3月的脸...
日期:04-10
Twitter同意10月17日庭审,但仍担心马斯克拖延_马斯克推特转发
讯 北京时间7月28日早间消息,据报道,当地时间周三,Twitter在一份法庭文件中表示,该公司不反对埃隆·马斯克的一项提议,即从10月17日开始对马斯克放弃440亿美元收购交易进行审判,但...
日期:07-31
助力大学生全力以赴逐梦人生,华为智慧PC联接每一份梦想与热爱「华为智慧生活电脑能用吗」
9月4日,华为携手中国人民大学举办“有为青年开学第一课”活动,邀请戴建业老师展开主题演讲,与高校学子直面沟通。充满无限活力的他们是整个中国社会力量中最积极、最有生气的力...
日期:09-09
荣耀90系列发布:全球首发3840Hz超高频屏幕技术「荣耀屏幕刷新率90的手机」
5月29日 消息:今天下午,荣耀正式发布了全新的荣耀90系列手机,这款手机不仅颜值高、设计时尚,还实现了业界3840Hz超高频技术的首次应用,成为全球首款零风险调光护眼屏手机。罗技...
日期:05-29
桌面风暴来袭 百度浏览器1.3正式版发布
  一直以来,百度坚持为用户提供最好的、符合用户需求的互联网产品,尤其近期人气直线蹿升的百度浏览器,在智能化和安全性等方面表现优异的同时,通过打通开放平台,为网民提供超...
日期:07-23
新直播地被质疑杭州安家,张大奕直接发声,怒怼黑粉!
  近期,6月17日张大奕在微博上发布了一组照片,照片中晒出了一套房子的图片,并表示终于可以休息一会。   从微博图中可以看得出来,房子空间很大,而且东西非常少,除了简...
日期:07-14