您的位置:首页 > 互联网

小却强大!TinyLlama:仅用90天、3万亿token训练的 550MB AI模型

发布时间:2023-09-08 23:26:49  来源:互联网     背景:

文章概要:

餐饮智能机器人

1. TinyLlama:一款小型但强大的AI模型,由新加坡科技设计大学的研究团队开发,仅占用550MB内存。

2. 该模型采用了稳定扩散XL技术,计划在90天内在3万亿代币的数据集上进行训练,旨在适应内存受限的边缘设备。

3. TinyLlama的成功将为实时机器翻译等多种应用提供高性能AI解决方案。

9月8日 消息:新加坡科技设计大学的研究人员正进行一项引人注目的项目,他们正在努力创建一款小型但强大的AI模型,这个模型被称为TinyLlama,它采用了一种紧凑的设计,仅占用550MB的内存。

小米mix5最新消息

这一模型的独特之处在于,它将在3万亿token的数据集上进行训练,这个庞大的数据集将在短短90天内完成训练。

汽车芯片市场空间

特斯拉hw4.0上市时

这个项目的目标是为内存受限的边缘设备提供高性能的人工智能解决方案。越来越多的开发者要求创建更小的AI模型,因为对于内存和计算能力受限的边缘设备来说,较少的参数更加优化。此外,较小的模型还可以用来协助解码更大的模型,正如前特斯拉高级AI总监Andrej Karpathy所言。

TinyLlama项目由新加坡科技设计大学的研究助理领导,他们试图在三万亿token的数据集上预训练一个11亿token的Llama模型。这个模型仅占用550MB的内存,团队认为它的紧凑性将使它能够满足多种应用的需求,这些应用需要受限的计算和内存占用,以实现诸如无需互联网连接的实时机器翻译等功能。

TinyLlama的训练于9月1日开始,使用了16个A100-40G GPU,团队计划在短短90天内完成训练。截止到目前,团队已完成了1050亿token的训练。

模型的构建者表示,他们正在使用与Meta用于训练Llama2的“完全相同的架构和分词器”,因此它可以轻松应用于基于Llama构建的开源项目。

TinyLlama团队正在使用包括Cerebras Systems的Slimpajama和StarCoder数据在内的三万亿token数据集,这些数据集曾用于训练StarCoder,这是一个代码生成模型。

一旦完成,TinyLlama将加入越来越多的较小语言模型的行列,这些模型由开发者用于构建各种应用。同时,EleutherAI的Pythia-1b和Databricks旗下MosaicML的MPT-1b也在取得进展。

项目网址:https://github.com/eivindbohler/tinyllama


返回网站首页

本文评论
电池巨头专利战:宁德时代不放手,要行政诉讼!中创新航危机未解?
本文来源:时代周报 作者:何明俊宁德时代(300750.SZ)诉中创新航(03931.HK)专利侵权案转向。中创新航8月3日公告,针对宁德时代以正极极片及电池、锂离子电池发明专利,对中创新航提出的...
日期:08-06
截胡小米 moto有望本月底首发骁龙8 Gen2
双十一结束高通就将正式发布骁龙8 Gen2芯片,而目前的节奏来看,小米13将是这颗芯片的首发机型,但moto依然不甘示弱,moto或联想曾多次拿到骁龙8系首发权,比如联想首发骁龙855,moto首...
日期:11-06
ipadpro2020屏幕是oled 屏幕吗「iPad Pro 2024款屏幕大升级:苹果首次使用OLED」
快科技5月8日消息,据9to5Google报道,苹果将在明年推出配备OLED屏幕的iPad Pro,这是苹果第一次在iPad Pro产品线上使用OLED材质,取代目前使用的mini-LED面板。分析师指出,苹果之所...
日期:05-08
一个进行微服务改造的手机银行有啥不一样?
  近年来,商业银行数字化转型大幕拉开,移动数字化是先行军,手机银行是主战场。有些银行的APP从一个单纯的工具演变为综合性的生活类APP,越来越像点评类产品;还有些银行专...
日期:10-14
iPhone14 Pro真机提前上手,没刘海就是香「iphone13pro无刘海」
中关村在线消息:8月18日,虽然距离iPhone新品发布会已不足一个月,但有关新机的配置以及渲染图已经曝光了不少,但这些都是猜测,并不能代表最后的真机。哪个品牌的电视盒子好用土耳...
日期:09-16
93%色情视频网站捆绑病毒 过半网民为看片关闭杀软
  4月20日消息,国内知名安全公司金山网络发布最新安全数据,93%色情视频网站被捆绑了病毒木马,而约五成访问者为了看片不惜铤而走险,关闭杀毒软件运行带毒播放器。金山网络安...
日期:07-27
谷歌终止AR眼镜项目 9月15日后不再提供软件支持
商业内幕(Business Insider)披露,谷歌放弃了AR眼镜项目。今年3月,谷歌发言人帕特里克·西博尔德(Patrick Seybold)透露,谷歌已经停止销售企业版谷歌智能眼镜,并将在今年9月15日后...
日期:06-27
iqoo neo7上市时间「iQOO Neo7 SE正式官宣 12月2日全球首发天玑8200」
2022年11月25日,@iQOO手机今日宣布新一代“120W性能神机”——iQOO Neo7 SE正式开启全渠道预约,并将于12月2日(周五)隆重发布。令人惊喜的是,iQOO Neo7 SE将全球首发联发科天玑82...
日期:11-29
当当网执行总裁:报复性还击挑衅绝不手软_当当网总裁抢公章
  “我认为,在商场上、公司里,如果要做成一番事业,就一定要敢于冒险,一定要寸步不让,永远进攻。”   女性企业家与高管在商界取得成功,依赖的最核心的发展力是什么?女性企业家...
日期:07-27
再突破!亨鑫科技跑进“新赛道”「亨鑫科技是外企吗」
通信世界网消息(CWW)近日,江苏亨鑫科技有限公司(以下简称“亨鑫科技”)以“无线智联 众享未来”为主题亮相第31届中国国际信息通信展览会,展台内容吸引众多参展者驻足观看。亨鑫科...
日期:06-11
雅虎上市股价_雅虎股价上扬 马云赴美或为伏“虎”打持久战
  受微软、阿里巴巴集团(以下简称“阿里巴巴”)等公司有意收购雅虎消息影响,上周雅虎股价强力上扬,全周涨幅超过14%。由于日前阿里巴巴集团董事局主席马云在斯坦福大学的演...
日期:07-23
诺基亚帮助微软WP7之法:补微软营销缺陷
  国外媒体撰文描述了诺基亚将如何大力推广Windows Phone手机。文章称,不同于三星、HTC、LG等将精力集中于多款手机制造的企业,诺基亚会将全部精力投入到推广Windows Phone...
日期:07-24
四川嘻嘻县哈哈寨「四川真有个哈哈村 网友:听名字就很快乐」
在四川冕宁县有一个名叫“哈哈”的村庄,因其特殊的地名而广为人知,当地的村干部表示这里的人都很快乐。除了哈哈村,国内还有一些有趣的地名,例如“宇宙”、“妈妈”、“高兴”、...
日期:07-14
天猫放弃跨店满减 将推出商品单价立减无需凑单「天猫跨店满减和淘宝跨店满减」
12月27日 消息:跨店满减已成为电商大促的标志,但今年年货节,天猫率先改变了这一传统。12月27日,天猫年货节预热正式启动,天猫首次推出“官方立减”商品直降,并取消延续多年的“跨...
日期:12-27
TikTok发布新功能,这种原创可转发到FB等平台_开通tiktok
8月18日消息,短视频平台TikTok最近发布了一项新功能,TikTok平台上的内容创作者可以将TikTok快拍(Stories,发布后24小时后消失)中的原创内容直接转发到社交媒体平台Facebook和Inst...
日期:08-19
Gartner:谷歌Gmail已成为企业电邮主流(gmail企业邮箱免费吗)
9月18日消息,据国外媒体报道,著名市场研究机构Gartner当地时间17日发布报告称,谷歌Gmail现已成为企业电邮主流,谷歌同微软竞争激烈使得第三者难以插足云企业电邮市场。 Gartne...
日期:07-23
喜茶为什么放开加盟_喜茶为什么放开加盟店
声明:本文来自于微信公众号 窄播(ID:exact-interaction),作者:肖超,授权转载发布。如果是过去是需要以麦当劳、肯德基等举例,说明加盟不一定就是件割韭菜的坏事;那么到今天,留给当...
日期:11-18
CES Asia 落幕,从科大讯飞产品看出这些趋势
  6月13日,为期三天的CES Asia 2019落幕。在今年的CES Asia上,5G、人工智能等成为大热名词。人工智能被称为第四次工业革命的重要推动力,而技术的发展,最终还是要落实到应用...
日期:08-11
优酷1毛钱7天会员不续费「优酷回应“1元会员”退费争议,视频平台会员拉新思路变了」
近日,有用户反映,参与优酷“1元会员”活动后,支付相应页面中弹出的实则为“优酷月月省”活动界面,支付1元后默认签约1年,除首月外,每月将自动扣费12元。兰博基尼aventador摩托罗拉...
日期:02-01
降价700元,iPhone背刺安卓高端路
声明:本文来自于微信公众号邻章(ID:TMT317),作者:邻章,授权转载发布。2月4日,iPhone14Pro全系降价700元,登上热搜。据业内人士爆料,自2月5日开始,苹果在国内市场正式推出限时优惠活动—...
日期:02-07