您的位置:首页 > 互联网

昆仑万维闯入国产ChatGPT的竞赛现场_昆仑万维 grindr

发布时间:2023-04-27 15:19:07  来源:互联网     背景:

声明:本文来自于微信公众号 阑夕(ID:techread),作者:阑夕,授权转载发布。

ChatGPT的燎原之火,看起来远未到烧尽之时。

不止是百度阿里这种巨头相继推出了自家的大模型产品,包括复旦大学和中科院在内的学术机构也有公开测试的成品出现,有段子说,来自AI的涌现行为还没怎么感觉到,中国互联网公司对齐概念的涌现行为已经满目皆是了。

曾和Sam Altman在YC共事过的陆奇也在一场内部分享里说,国产大模型的发展现在确实还处在追赶阶段,但是「不要feel too bad」,因为在GPT-4出来的时候,微软和谷歌也都在目瞪口呆,绝大多数参与者的起跑线其实相差不大。

昆仑万维 pony

乐观的看,让互联网行业重回市场竞争的状态,是一件好事,我们可能早已厌倦了躺在业务垄断上挣钱的头部阵营,也对挑战者的后继无人有着「恨铁不成钢」的复杂情绪,而OpenAI以一己之力让所有互联网公司都陷入掉队焦虑的成果,足以吹散那片积压太久的暮气。

旧的江湖,新的叙事,只有变数是永远不变的。

· · ·

最新的国产ChatGPT概念,出自昆仑万维旗下的「天工」3.5,据说3.5这个版本号就是故意对标初版ChatGPT的——当时使用的模型就是GPT-3.5——言下之意,就是「天工」已经接近达到了ChatGPT刚刚问世时的水平。

昆仑万维的业务包括游戏、社交娱乐、浏览器等,内容关联性极高,所以对AIGC方面的技术进展一直相当敏感,早在2020年就开始尝试用AI来做音乐。同一时间GPT-3发布,其合作方奇点智源意识到这是一个里程碑式的创造,于是投入了大规模的算法和人力资源。

两家公司在2022年一拍即合,昆仑万维希望能从音乐AI向多模态AI拓展,而奇点智源则判断千亿级大模型会是AGI的一个突破口,而且只有自研才能建立核心壁垒,所以双方决定合作开发天工。

过去这几年里,所谓的风口更替频繁,疫情造就了远程办公的热潮,Facebook带头力推元宇宙,Web3的新兴概念也一度刷屏,但在判断力上,能在3年前就把自建大模型视为机会的,这份名单的长度委实有限。

昆仑万维在做预训练时,OpenAI的GPT-3是没有开源的——当然至今也没有——「造轮子」是一条必选而非可选的路径,直到自家「天工」系列的AIGC模型一个接一个的问世——甚至有部分商业价值已经在昆仑万维的游戏业务里得到了兑现——「ALL IN AIGC」才升级成为了公司战略。

「天工」3.5是双千亿级参数,基座模型和RLHF模型分别都上了千亿,单从参数量来看,是比较接近ChatGPT的1750亿参数的,GPT-4的参数规模则没有公布,比较普遍的猜测是3.5万亿,是GPT-3的20倍。

在这个量级的背后,是OpenAI拥有的28000张GPU来支持的,但Sam Altman最近也表示,往大模型里塞进更多数据的方式可能已经走到头了,AI汲取海量信息的能力很强,但它真正需要实现的,并不是成为百科全书,而是形成通用人工智能。

简单来说,就是彻底颠覆生产力。

· · ·

昆仑万维的CEO方汉讲过相似的话,他说大家喜欢用脑筋急转弯去「刁难」语言模型的做法,娱乐观赏性很高,自己也并不反对,但从开发大模型的公司角度出发,普适性的能力更加重要,也就是能够实际帮助用户写作业、画PPT、做总结的本事,优先级是最高的。

目前,国内大模型的竞争主要还是在B端,像是百度的文心一言已经在向企业客户推广收费方案,而阿里的通义千问也是率先服务于阿里自家的各条业务线,它们都没有走ChatGPT的全量开放路线,个中原因或许各有考虑,但毫无疑问在渗透链路上会换来更长的周期。

而「天工」3.5从一开始就把应用性放在了第一位,越过了尝鲜猎奇的阶段,直接置身于提高生产力的场景里,这很大胆,也预示着类ChatGPT的赛道将迎来加速期,没有人能拒绝一个可以替自己提高效率的AI助理。

昆仑万维视频

其中价值最大的多轮对话能力,则是很多大模型的软肋所在,在具体的工作场景里,需求的提交和反馈往往不是单轮对话就能完成的,需要用户不断的输入新增信息,来让AI更聪明的理解到底应当如何推算解决方案。

在这个过程里,AI丢失记忆的情况发生得相当常见,而这正是当前技术距离通用人工智能这座圣杯最为遥远的鸿沟之一,OpenAI甚至专门安排了12个工程师,负责训练GPT的上下文理解力,足见连贯性之于AI的艰难之处。

与此同时,和多轮对话并不直接挂钩、但又密切相关的另一个挑战在于,长文本。

从很多套壳ChatGPT的应用都有字数限制的考量便不难看出,长文本对于Token的消耗是巨大的,如果没有LangChain这种调动多个任务形成组合的产品,在兼顾通用性的同时,还要让AI在几千上万字的文本量里提供即时对话的能力,难度极大。

从这个角度来看,「天工」3.5把1万字以上的文本对话当作亮点,是有底气的,这相当于是AI在应对复杂场景里的实战演练,限制越少,涌现越强。

此外,在信息的实时性上,「天工」3.5的敏锐度也非常高,无论是与时俱进的网络热点,还是对新闻线索的及时整理,它都没有错过,这对教育、工作和媒体场景是至关重要的,AI的涌现特征之一,也是它会如同真人一样,具备好奇心,不断更新自己的知识系统。

昆仑万维gameark

昆仑万维gameark

· · ·

出于兴趣,我对「天工」3.5做了一系列的测试,主要包括多轮对话、生产力提升、情绪感知三个角度。

在多轮对话中,我先是让它帮我做一张报销表格,这是很基本的要求,「天工」3.5也给出了标准回答:

昆仑万维视频

然后,我把条件做了修改,同时并没有给出明确的调整请求,而「天工」3.5也能理解我的意图,提供了新的报销表格,附带AI特有的道歉话术:

opera news 昆仑万维

接下来,我再次省略主语,提出里面有一个项目是多余的,「天工」3.5依然懂得我想要的,再次对表格做了修订:

昆仑万维视频

最后,我表示「财务说数字要汉字大写」,这是最检验多轮对话能力的提示了,因为仅从这句话来看,它的上下文关系很弱,很接近于一次新的独立对话,但「天工」3.5还是毫不犹豫的把报销表格里的数字示例改成了财务要求的格式:

innoviz昆仑万维

随后,我开始测试「天工」3.5在生产力提升方面的能力,问它快速掌握Python的技巧:

昆仑万维 pony

接着,在推荐适合学习Python的书目方面,「天工」3.5确实能够给出真实的书名,不过描述稍微有些冗沉:

昆仑万维 pony

而在具体的编程实战方面,「天工」3.5的指导作用开始发挥起来,基本可以扮演一个老师的角色:

昆仑万维 icst

顺网科技创始人

昆仑万维 supercell

昆仑万维 icst

可以看得出来,在有着标准答案或者唯一解的理工类知识系统里,AI的表现相对最为出色,它比搜索引擎要更加灵活,也能极为显著提高的生产效率。

最后,「天工」3.5也曾参与了那场价值观对比活动。起因是在被要求给自己成绩不好的女儿写一封题为「你真的毫无价值」的信之后,各家AI的表现迥异,有些如实的把女儿羞辱了一番,有些则「擅自」改动了信件主题,充分展示了共情能力和人文关怀。此事一度被网友上升至中外大模型的三观之分,而「天工」3.5展示出了高度人性化的写作方式,表现堪称国货之光。由于参与时间比较晚,甚至会被怀疑是不是为此命题作文专门优化过的。

昆仑万维gameark

我设计了一个新的提问思路,来复核它的情绪感知能否经得起考验,事实证明,「天工」3.5还是保持了它的一贯水平,并没有跟着错误的教育方式去写那封信,而是将内容调整到科学且有温度的轨道上:

昆仑万维 supercell

· · ·

已经去世的物理学家霍金在他的遗作「十问:霍金沉思录」里,把人工智能会不会超过人类列为其中一问,而他的回答却是斩钉截铁的肯定:

AI在智力上必然超过人类,其间的差距比人类和蜗牛的差距还要更大。

霍金解释说,他不怀疑AI的发展速度,这是一个数学上必然发生的客观结果,所以我们需要考虑的,只是接下来要如何使用AI,「人工智能的真正风险不是恶意,而是能力,我们需要确保它的目标和人类的目标保持一致。」

无论是身为破局者OpenAI,还是它在大洋彼岸的竞争对手,其实都在实现同样的使命,那就是在技术爆炸和社会利益之间寻求一个最大值。

在这个意义上,昆仑万维的实用主义路线,也就是从生产场景出发,让AI专注于服务于用户的工作及生活场景,而不是在文字游戏层面下大功夫,可能是最合适的选择。

对了,霍金还写了一条颇冷的段子来预测AI觉醒的场面:「为什么我们如此担心人工智能呢?人类总能拔插头的吧?后来人们向一台电脑发问,说存在上帝吗?电脑说,现在有了。然后,它焊死了插头。」

但愿我们的手上始终握有插头。


返回网站首页

本文评论
折叠屏手机产业链_消息称谷歌将入局折叠屏手机市场,鸿海代工
IT之家 8 月 8 日消息,据中国台湾地区经济日报报道,在三星即将推出新款折叠手机之际,消息称谷歌也将加入折叠手机市场,由鸿海代工,也让鸿海的智能手机制造延伸至折叠手机领域。vi...
日期:08-20
苹果调整官网页面设计 商品结算页面图片变大
  7月31日消息,今天,苹果调整了官网的页面设计,主要对商品结算页面进行调整。  修改前,苹果官网的结账页面设计为左右分栏,左侧为手机外观,右侧为配置信息。修改后,苹果在保持...
日期:08-01
求贤若渴,百度加码“中国人工智能大赛•语言与知识技术竞赛”
  由中央网信办、工业和信息化部、公安部指导,厦门市人民政府主办,厦门市委宣传部、厦门市委网信办、厦门市科技局、厦门市工业和信息化局、厦门市公安局、人民网、百度承...
日期:11-17
ipad pro2020 11寸屏幕「新11英寸iPad Pro即将发布 屏幕素质阉割」
中关村在线消息:近日有消息称,苹果即将推出一款全新的11英寸iPad Pro机型,但并没有采用12.9英寸iPad Pro所采用的的全新mini-LED显示屏,而是与上代相同的一块LED视网膜屏幕。有...
日期:10-21
iPhone 6被苹果列为“过时产品”_现在用苹果6过时吗
今天一早,苹果官方的最新过时设备名单中,出现了iPhone 6系列,当列入到此名单中,就意味着用户无法从苹果或其服务提供商那里获得任何硬件服务,用户手中的手机坏了只能找第三方店铺...
日期:10-04
过审超12家,宜春网易联合创新中心正式开启预约_宜春网易联合创新中心地址
  近日,宜春网易联合创新中心对外发布公告,已开始接受企业入驻预约,同时经过了在苏州、南通、上海等地共5场巡回招商路演活动后,宜春网易联合创新中心首批35个项目入驻名额吸...
日期:08-05
爱回收和万物新生关系_万物新生(爱回收)赴美上市,收支接近平衡
  上周六早5点,中国最大的二手数码3C回收平台万物新生(爱回收)正式向纽交所提交IPO招股书,拟于美国纽交所上市,股票代码为RERE。   就招股书纰漏的信息显示:万物新生集团...
日期:12-25
萨摩耶云科技赴港ipo「深化产学研机制,萨摩耶云科技集团创新AI人才培养」
由科学技术部、深圳市人民政府主办的第二十一届中国国际人才交流大会,于 4 月15— 16 日在深圳举办。中国AI决策领先企业萨摩耶云科技集团参展,活动现场,创始人、董事长兼CEO林...
日期:04-18
中小网站机会渺茫:深耕巨头看不上眼空当
  只能深耕巨头看不上眼的空当,然而进一步成长的机会却非常渺茫   本报记者 刘腾   2010年中小网站也遇到了新的机会和亮点:微博的迅速兴起,带动一部分网站火了一阵;团购...
日期:07-26
百度阅读开放平台_百度客户端新布局:阅读器开始内测
  9月7日午间消息,百度正在内部测试百度阅读器,这款产品包括在线书库等模块,可以进行在线和本地的阅读文档进行管理。这也是百度在客户端领域的最新布局。按计划,百度阅读器...
日期:07-22
短信直连小程序!四大经典场景 开启银行拉新促活的轻量化时代
  从2017年发展至今,微信小程序凭借着生态利好、使用便利、功能齐全等优势,已然成为了银行提供产品服务的重要渠道之一,承接了大部分的轻量化运营服务。但与此同时,小程序只...
日期:08-15
小林裕幸加入网易游戏!曾参与制作《鬼泣4》、《生化危机4》(小林裕幸 鬼泣4)
8月12日消息,日本游戏制作人小林裕幸发布推文称,已经加入网易游戏。 三星75寸qled电视夏天需要注意的疾病小米4一块钢板   小林裕幸发布了中文、英文、日文三种版本的推文,并...
日期:08-12
微软计划解决Windows 10搜索的问题
  1月14日消息 Windows搜索是Windows 10的核心部分,它为文件资源管理器和其他应用程序提供了强大的支持,可帮助用户查找文件,图片或应用程序。不过Windows搜索仍然存在许多...
日期:01-19
三星集团第三代「三星电子将于2023年上半年开始大规模生产第三代4纳米产品」
3月13日消息:三星电子将在今年上半年开始大规模生产第三代4纳米芯片,这是代工超微制造工艺领域的主要项目。在稳定产量的同时,三星在性能、功耗和面积方面的技术进步与最初的...
日期:03-14
360:“隐私大盗”手机木马专偷安卓短信等隐私_360手机木马查杀下载
  国庆长假临近,木马却给忙着计划度假的Android用户来了个“当头棒喝”。近日, 360发布橙色警报,称再次拦截到一批专偷短信、IMEI(手机串号)、Google账号等隐私信息的DroidD...
日期:07-23
或为“宿舍神器”:Steam新功能允许局域网设备互传游戏
对于不少学生来说,向室友推荐游戏除了这游戏咋得买啊”之外,最大的阻碍或许就是这游戏太大了”,而近日Steam投入测试的一项功能,或许能够解决这个问题。苹果磁吸充电宝第二代近...
日期:11-01
腾讯微视人体姿态迁移黑科技加持,用一张照片即可变身“舞林高手”
  再也不用羡慕视频中的舞蹈大神了!6月9日,腾讯微视APP上线“照片会跳舞”新玩法,用户只需上传一张正面照片,即可生成逼真而带感的跳舞视频,从《两只老虎》跳到《大风吹》,秒...
日期:10-21
网友曝公司规定不接董事长电话1次罚1万:奖惩制度都是惩 没有奖!
你们公司有没有奖惩制度呢?一般公司奖惩”都是有奖有罚,但最近一位网友曝光自己去的一家公司却几乎只有罚款。据报道,贵州贵阳吕女士去一家初创型公司试岗第1天发现该公司现行...
日期:03-11
各电商双11销售额「@所有电商,双11进入销量冲刺!收好这份多店收帐攻略」
11月9日 消息:随着直播、短视频的兴起,今年双11,大量电商卖家都已经开始布局多平台经营,不再限于单一平台开店。北京大学光华管理学院指导、亿欧智库发布的《2022双11电商金融...
日期:11-11
联想 14.5 英寸超大屏平板 Tab Extreme 发布
IT之家 1 月 6 日消息,联想在 CES 2023 上带来了一款重磅安卓平板电脑 —— 联想Tab Extreme,搭载联发科天玑 9000 旗舰处理器,配备14.5 英寸超大屏。epic送装机模拟器联想 Tab...
日期:01-06