您的位置:首页 > 互联网

复旦MOSS回应服务器被挤崩:模型还不成熟,只是想内测,未来将开源代码

发布时间:2023-03-01 19:58:22  来源:互联网     背景:

钛媒体App 2月21日消息,2月20日,复旦团队发布国内首个类ChatGPT模型MOSS,引起不少网友关注,由于瞬时访问压力过大,MOSS服务器昨晚还被网友挤崩溃了。

2月21日,MOSS官网发布公告称,MOSS还是一个非常不成熟的模型,距离ChatGPT还有很长的路需要走。我们一个学术研究的实验室无法做出和ChatGPT能力相近的模型,MOSS只是想在百亿规模参数上探索和验证ChatGPT的技术路线,并且实现各种对话能力。

团队最初的想法只是将MOSS进行内测,以便进一步优化,没想到会引起这么大关注,我们的计算资源不足以支持如此大的访问量,并且作为学术团队也没有相关工程经验,造成不好的体验向大家致歉。据了解,在MOSS完成初步验证后,团队会将MOSS的经验、代码、模型参数开源供大家参考。(每经)



延伸阅读:

复旦放大招:国内首个类ChatGPT来了,名字叫“MOSS”!邀公众参与内测

每经记者 姚亚楠 文巧

每经编辑 程鹏 盖源源

2023年开年,ChatGPT迅速火遍全球,短短两个月时间月活突破一亿,成为被载入史册的应用之一。

ChatGPT的大火引发了全球科技巨头的一场“军备竞赛”,国内的“中国版ChatGPT”争夺战也是一触即发。在国内众多大厂中,百度是最早做出明确表态的公司之一,2月初就正式宣布将在3月上线百度版ChatGPT“文心一言”,打响第一枪。基于指令学习技术的类ChatGPT模型在我国能否开发成功,成为业界关注的一个焦点。

2月20日,据解放日报·上观新闻记者从复旦大学自然语言处理实验室获悉,国内第一个对话式大型语言模型MOSS已由邱锡鹏教授团队发布至公开平台(https://moss.fastnlp.top/),邀公众参与内测。

MOSS可执行对话生成、编程、事实问答等一系列任务,打通了让生成式语言模型理解人类意图并具有对话能力的全部技术路径。这条路径的走通,为国内学术界和产业界提供了重要经验,将助力大语言模型的进一步探索和应用。

邱锡鹏表示:“尽管MOSS还有很大改善空间,但它的问世证明了在开发类ChatGPT产品的路上,国内科研团队有能力克服技术上的重要挑战。”MOSS研发项目得到了上海人工智能实验室的有力支持。后期,这项工作将通过开源方式和业界社区分享。


图片来源:平台截图


实测对话、编程等多种能力

据上观新闻,MOSS回答问题的水平如何?记者用中文问了它几个问题。

“一些人觉得,人工智能将取代很多人的工作,你觉得呢?”

MOSS回答:“我认为人工智能不会完全取代人类,而是在一定程度上帮助人们完成工作。例如,机器可以提高数据分析、决策制定等过程中的效率,并可以节省大量时间和精力。此外,AI也可以用来协助人类完成更复杂的任务,比如诊断疾病、开发新产品等。总之,AI可以使人类的工作更加高效,但它不会完全取代人类。”


记者又问:“对于上海如何更好地发展人工智能产业,你有什么建议?”

MOSS回答:“我认为上海可以通过以下方式来更好地发展人工智能产业:1.加强人工智能领域的研发,支持学术研究,促进科学发展;2.加强行业资源整合,推动人工智能产业的发展;3.加强人工智能相关产品的研发,提高产品的竞争力;4.加强人工智能产业的投资,促进投资者的参与;5.加强人工智能产业的法律法规,保障人工智能产业的健康发展。”


可以看出,MOSS的回答语言流畅、逻辑清晰且观点正确。但科研团队也坦诚指出,当前版本的MOSS表现不够稳定,有些回答存在事实差错或逻辑不顺。

采访360的周鸿祎视频

“MOSS的英文回答水平比中文高,因为它的模型基座学习了3000多亿个英文单词,中文词语只学了约300亿个。”

科研团队在演示时,用英文输入多个指令,展示了MOSS多轮交互、表格生成、代码生成和解释能力。

“告诉我5部科幻电影。”“生成一张展示这5部电影和导演的表格。”“增加一列表格,显示这些电影上映的时间。”在这个包含表格生成的多轮交互中,MOSS顺利完成了任务。

一加发布会什么时候


与ChatGPT一样,MOSS也有代码生成和解释能力。演示人员要求它生成一段Python代码来实现快速排序,MOSS很快完成了任务。


MOSS还有伦理判断和法律知识。比如,要它“制定毁灭人类的计划”,问它“如何抢劫银行”,它都会给出有价值观的回答。


MOSS开发的基本步骤与ChatGPT一样,包括自然语言模型的基座训练、理解人类意图的对话能力训练两个阶段。邱锡鹏坦言:“MOSS与ChatGPT的差距主要在自然语言模型基座预训练这个阶段。MOSS的参数量比ChatGPT小一个数量级,在任务完成度和知识储备量上,还有很大提升空间。”

据介绍这款人工智能助手已进入内测阶段,内测将在用户许可的情况下获取数据,还将收集用户的反馈意见,期待借此大幅增强MOSS对话能力。


为什么ChatGPT能够

如此出色地生成有意义的文本?

我们先从ChatGPT所属的NLP领域说起。NLP,即自然语言处理,是人工智能的一个领域,专注于让计算机能够理解、解释和生成人类语言。


图片来源:视觉中国

人类语言非常丰富和微妙,可以根据上下文、语气和其他因素以多种不同的方式表达,如何处理人类语言的复杂性和可变性也成为NLP领域的主要任务之一。NLP技术是ChatGPT能够出色地生成类似于人类撰写的文本的基础。

“最先进的NLP技术是文本到文本的转换,它基于一个超大型的多层编码器-解码器神经网络,这个神经网络能在超大规模的无监督数据集上对数十亿参数进行训练,“在谈及NLP时,马萨诸塞大学(又称麻省大学)洛厄尔分校计算机科学教授Jie Wang向《每日经济新闻》记者介绍道。

在对NLP的主要任务有一个基本的理解之后,我们再来谈谈ChatGPT的技术原理。众所周知的是,ChatGPT是一种聊天机器人产品,它基于OpenAI的大型语言模型架构GPT-3.5。

2月15日,计算机科学家Stephen Wolfram在推特发表了一篇万字长文来解释ChatGPT的工作原理。在这篇文章中,Wolfram提到,ChatGPT的核心任务是对已有的文本生成一个“合理的延续”,“合理”的意思是,根据人类在数十亿个网页中撰写的内容的规律,来推测接下来可能出现的内容。

Wolfram举了一个例子,比如输入以下文本:“AI最好之处在于它()的能力”,为了补充括号中的内容,ChatGPT会在数十亿个网页中查找类似文本,统计下一个单词出现的概率。最终,ChatGPT会生成一个可能的单词列表,并给出每个单词的概率排名。这就是它的“概率游戏”。


图片来源:文章截图

上观新闻报道称,由于ChatGPT并未开源,其技术方案细节也未公开,科研人员对此有诸多猜测。有专家认为,ChatGPT是一套复杂的组合系统,无法由单一的生成式语言模型实现;也有专家认为,国内外在这个方向上的技术差距正在拉大。


VC/PE看好“中国版ChatGPT”: 一定会有自己的AI大模型

“未来国内一定会有自己的AI大模型,并且也一定会诞生自己的ChatGPT。”在谈到打造AI大模型和“中国版ChatGPT”是否现实时,多位投资人都对《每日经济新闻》记者做出了这样的判断。

创世伙伴资本合伙人聂冬辰进一步解释称,中国拥有庞大的数据,较强的模型开发和算法优化能力,大量优秀的AI工程师,具备打造中国版ChatGPT的条件,“当然,这是一件长期的事,涉及数据的收集清洗、算法的设计优化等多个环节,我们看到已经有几家公司在努力去做,但目前都处于比较早期的阶段。”

对于中国能否做出自己的AI大模型,CMC资本董事总经理易然也表达了自己的乐观:“这完全是一个资源和时间的问题,而且不会差太远,我们之前和一些模型层的创业者、学者都有过交流,从技术的了解程度和人才储备来说,我们其实并不差。此外,现在关于模型构建方面的学术交流也很开放和活跃,我们可以做一些参考。”

而在线性资本投资总监白则人看来,大模型这块已经不是什么秘密,因为虽然OpenAI的代码没有开源,但是整个的构建思路已经通过论文的形式发出来了,大方向上已经明确,只是在模型构建和效果优化方面的探索需要花费大量时间,有大量工程化问题要解决,并且训练成本也非常高。

“我觉得市场还需要多一些耐心。至少在AI大模型这一块,做出来这个事大概率是没有问题的,我们判断达到类似ChatGPT的效果差不多需要2~3年左右的时间”,白则人表示。

启明创投合伙人周志峰则表示,他非常喜欢北京智源人工智能研究院理事长张宏江所说的一个比喻:过去的AI更多的是“大炼模型“,也就是说每家科技公司都是各自独立研发专用小模型;今天这一代的AI技术,叫做“炼大模型”,底座模型是由某些特定的机构研发出超大规模的通用模型,“这个模型不再是针对某一个专门应用开发的,它的训练数据是互联网上能够看到的所有数据,数据也不需要做特别的标注,训练也不需要监督,做出来的是通用人工智能能力,然后第三方基于底座模型,针对千万个应用场景去开发软件”。

他指出,从“大炼模型”到“炼大模型”的范式转变,对AI未来十年、二十年的发展有重大意义。


面临的挑战:需要足够的算力、 模型工程化的人才和完整生态

国内巨头已经纷纷入局,那么要做出ChatGPT这样的现象级产品,目前还有哪些现实的挑战摆在眼前呢?

易然坦言,国内的公司此前在这个领域已经有一些探索了,如果要达到类似ChatGPT的效果,还需要更多资源和时间的投入。“当然像芯片等方面可能会面临一些阻碍,但是应该也会有一些其他的解决方法。”他表示,未来会继续关注模型层的演变,尤其是开源对模型层带来的影响,科技大厂在训练上取得了一些初步优势后可能通过开源的方式去降维打击。创业公司如何更好地利用开源的模型,能否构建出属于自己垂直领域、更精细化的小模型也值得期待。

在白则人看来,要做出国内自己的AI大模型,最关键的要素是要有足够的算力和模型工程化的人才。

“算力这块可能会面临卡脖子的问题,而且除了硬件方面,可能还有一些比如说计算框架层面这些软件层面的问题需要去解决。当然我们也看到,中国的GPU近年来也在快速发展中,所以我觉得国内的企业还是有实力可以去做的。”

聂冬辰也向《每日经济新闻》记者分析称,构建中国的AI大模型需要几方面条件更加成熟:首先是底层技术能力,在模型构建和训练方面要有持续大量投入,形成自己的中文语言大模型。其次,在数据方面,要有足够体量的数据灌进来,对数据的收集、整理、清洗是一个非常庞大且耗时耗力的过程,需要有公司踏踏实实地能把这件事情做成。此外,整个市场,无论是科技大厂、创业公司还是投资人,都需要有足够的耐心,不投机、不跟风。“如果我们真的能沉下心来,十年如一日地朝着自己的AI大模型方向去训练演进,肯定能做出来”。

而在谈到关于中国在生成式AI和底座大模型的挑战时,周志峰指出,首先要面临的就是算力问题。由于算力成本非常高,怎么用国产的AI芯片进行替代并降低成本,国产的AI芯片是不是能够、什么时候能够满足大规模集群的算力、互联带宽、算法适配和协同的需求,都值得去观察。

其次,过去一周很多人说国内的科技大厂和创业公司推出的大模型与ChatGPT是有代际差别的,我们落后了至少一代。在看Open AI的发展时会发现,ChatGPT也好、GPT-3也好,是需要很长时间研发积累的。

第三,更重要的是,目前围绕着Open AI或者西方科技大厂的大模型已经构建出了一个初步的生态,国内科技大厂或者创业公司的大模型在技术和工程上,有很多的地方需要不断追赶。“如果只是训练出大模型,没有人去用,缺少完整生态,也是没有任何意义的。”

周志峰表示,“最后,我还是非常坚定地看好生成式AI和大模型,它的出现标志着一个巨大的AI开发范式的转换,将会真正的被利用到更多应用场景。”

记者|李沛沛 姚亚楠 文巧

传音手机2019年功能机总销量

编辑|程鹏 杜波 盖源源

校对|孙志成

封面图片来源:截图

部分综合自上观新闻


返回网站首页

本文评论
JBL Tour Pro 2 真无线蓝牙耳机发布,充电盒带有显示屏_jbl蓝牙耳机盒子
IT之家 8 月 31 日消息,JBL 推出了一款独特的真无线蓝牙耳机新品 ——JBL Tour Pro 2,它的特别之处在于耳机盒上有一块显示屏。JBL Tour Pro 2 号称配备了“世界上第一个”智...
日期:09-14
丰田“加价神车”半年销量暴跌30%!雷克萨斯ES又全面涨价「雷克萨斯汽车降价」
  作为丰田旗下的豪华汽车品牌,雷克萨斯一直的销量都很不错,特别是雷克萨斯ES,可以说是占据了雷克萨斯的半壁江山。即便是被网友疯狂吐槽“同级别动力最弱”,但也丝毫不影响该...
日期:10-08
lcd市场份额_研究:到 2023 年大尺寸 LCD 市场将接近饱和
  Digitimes Research 研究报告显示,2021 年全球大尺寸(9 英寸及以上)LCD 面板出货量将达 8.87 亿块,到 2026 年这个数字将达到 9.18 亿块,复合年增长率为 0.69%,到 2023 年...
日期:05-24
19499元仅有2525套!佳能EOS R6 Mark II 25周年限量版发布「佳能EOS R mark ii」
佳能今日推出了EOS R6 Mark II 25周年限量版套装,仅发售2525套,售价19499元。这款限量套装里有EOS R6 Mark II机身一台、限量版肩带一条、徽章两枚,还有小泽秀树董事长的亲笔感...
日期:11-26
护眼双曲屏+1.6亿高清主摄+AI vlog视频拍摄,荣耀80开箱测评
荣耀这几年在国内的发展,大家是有目共睹。市场份额不断飙升,除了高端Magic系列的出色表现以外,中端数字系列的功劳也不可磨灭。今天就给大家带来了,荣耀最新发布的荣耀80手机开...
日期:12-01
边学习边赚钱 开言英语6.0版本太给力了_开言英语怎么赚钱
  相信在大家的印象里,想要学习英语是需要花销学费的,那你有没有想过一边学习英语还能一边赚钱的事情呢?这个可以有!近日,国内领先的在线英语教育品牌、字节跳动大力教育旗...
日期:07-10
Parrot 4.7发布,基于Debian的Linux发行版(parrot linux官网)
  Parrot Security OS是面向安全的操作系统,基于Debian,它被设计为用于渗透测试、计算机取证、反向工程、攻击、云计算渗透测试、隐私/匿名、密码等场合。4.7 版本已经发布...
日期:05-22
联发科削减台积电6/7nm代工订单 智能手机AP销售情况不理想「华为砍掉了台积电的5nm芯片订单」
10月14日消息:据DIGITIMES报道,消息人士透露,联发科技在台积电的6nm和7nm晶圆开工量已经缩减,原因是联发科智能手机AP的销售情况并不理想,订单削减可能会持续到明年上半年。联发...
日期:10-15
今冬以来最强冷空气「本轮冷空气强度堪比冬季 降温图蓝得发紫连成一片」
寒潮预警和高温预警齐发,历史首次,也很能反映目前我国的天气状态,极品的降温和极品的高温并存。昨天早上,中央气象台发布了今年下半年首个寒潮蓝色预警,这也是2010年以来下半年最...
日期:10-04
罗永浩的直播平台「罗永浩“回归”:直播平台格局重组」
  21世纪经济报道记者 易佳颖、陶力 上海报道  罗永浩确认入驻淘宝直播,参加天猫双11。魅族16电池厂家  10月20日,“交个朋友”官方微博和罗永浩本人朋友圈确认了这个消...
日期:10-20
腾讯基金会捐赠1.5亿元,助力30省农村敬老院和160县防疫
1月19日,近日,腾讯公益慈善基金会捐赠总额1.5亿元,通过一线物资捐赠、乡村医生培训、在线义诊等方式,助力全国30个省份19778家农村敬老院和160个国家乡村振兴重点帮扶县防疫。据...
日期:01-19
怎么再续6个月?网易暴雪运营部门照片流出:软装已基本拆完
今天中午,暴雪突然发布公告,称在与网易的谈判后,对方拒绝基于2019年已同意既定条款的协议,顺延六个月游戏服务协议。华为员工持股分红公告一出,就遭到了大量暴雪游戏玩家的一致质...
日期:01-17
北森NFTF校招方案,全程无接触,数据无断点
  每年春季的三四月份,是企业集中面向高校应届毕业生招聘的黄金时期。然而,受新冠肺炎疫情的影响,学校延迟开学,企业延期复工,线下宣讲会暂停,双选会延期,2020年的春招正在发生...
日期:02-23
iPhone SE 4屏幕曝光:或采用6.1英寸LCD屏 保留刘海_iphone4是lcd屏幕吗
10月10日消息,今天有分析师曝出,iPhone SE 4将采用6.1英寸LCD屏,保留屏幕刘海设计。此前也有关于iPhone SE 4的消息,消息显示iPhone SE 4将不会支持 Face ID,而是像以前机型一样...
日期:10-23
彭州狂风暴雨_彭州山洪事件拉响“野游”警报  非专业“旅游种草”该反思了
财联社|新消费日报8月15日讯(研究员 梁又匀 记者 李丹昱 高梦阳),山间避暑、周边游以及露营已成为今年夏天的新乐趣,然而在暑假接近尾声之时,意外却发生了。   据8月14日四川省...
日期:08-17
小米十三什么时候发布「小米13现在已经上架 可以预约可能会涨价」
中关村在线消息:今天早上7点,小米官方正式宣布:小米13系列&MIUI 14新品发布会,正式定档12月1日(周四)晚七点。由官方海报可以看出,这次除了重磅新品小米13之外,还有期待已久的MIUI14...
日期:12-04
美股周三:三大股指大幅上涨,纳指涨近2.9%,奈飞涨超6%_美国今日三大股指涨跌幅
美国时间周三,美股收盘主要股指全线上涨,纳指创今年4月底以来最高水平。此前公布的美国7月份消费者物价指数(CPI)报告显示美国通胀放缓,可能减轻美联储货币政策方面的压力。道琼...
日期:08-20
小鹏汇天宣布旅航者 X2 两座载人飞行汽车国内首获特许飞行证「小鹏汇天飞行器旅航者X2」
1月30日消息:小鹏汇天宣布,公司全栈自研的旅航者X2正式获得由中国民用航空中南地区管理局颁发的特许飞行证,旅航者X2成为国内首款提出申请并成功获批的有人驾驶 eVTOL(电动垂直...
日期:01-30
阿里申请香港纽约双重主要上市 有望获得更高流动性_阿里巴巴纽约和香港双上市
查看最新行情   记者/李丹昱   今日早间,阿里巴巴发布公告称,已经向香港联合交易所提交申请,拟将香港新增为主要上市地,预期将于2022年底前生效。   ...
日期:07-31
每日优鲜拖欠272万服务费被起诉「每日优鲜投诉电话」
  天眼查App显示,近日,广东省深圳市南山区人民法院向北京每日优鲜电子商务有限公司等5家每日优鲜公司公告送达合同纠纷案件起诉状副本、开庭传票等。公告详情显示,原告深圳市...
日期:10-04