您的位置:首页 > 互联网

字节君 抖音号「字节版ChatGPT悄悄开放,免费无排队,抖音号手机号直接登」

发布时间:2023-08-19 18:01:48  来源:互联网     背景:

克雷西 鱼羊 发自 凹非寺
量子位 | 公众号 QbitAI

字节跳动版ChatGPT,现在人人可玩了!

网页版、安卓版和iOS版同步上线,用抖音账号、手机号和苹果账号都能登录。

并且无需排队,打开就能和这个名叫“豆包”的AI助手直接开聊。



是doubao.com不是douban.com噢~

消息一出,已经有不少胖友第一时间前往围(tiao)观(xi)。



我们也抓紧实测了一波~

与ChatGLM难分伯仲

先来看看豆包是怎么介绍自己的:



既然如此,我们就来试试这些“官方功能”靠不靠谱。

比如,我们挑选了几个有意思的错误机翻让豆包纠正,结果豆包给出的反馈还挺不错的:



尤其是“鸳鸯锅”的翻译,可以说是完胜Google和DeepL。

字节君 抖音号



知识方面的话,当然要问一下“刁钻”的问题了:雷公电母放出的电是直流电还是交流电。

豆包的这个回答,可以概括成“不是直流电,而是直流电”,但前面说的还算可以吧。



抛开整活的话,豆包的开胃小菜的确给了我们一个不错的第一印象。

那么下面我们就上正餐——来拿它和备受好评的国产开源大模型ChatGLM进行一场大横评。

具体的内容包括文案创作、逻辑推理、数学和代码四个方面。

文案创作方面,豆包说自己会撰写知乎、小红书等各种风格的文案。

我们不妨整个奇葩点的东西,看看它能不能创作得出来,比如……豆汁美式的小红书笔记。



文案搭配着emoji,连Tag都有了,看来豆包真的是懂小红书的。

不过你确定“醇香甘甜”这个词是用来形容豆汁的吗……

ChatGLM虽然写了很多,但是没审清题,把豆汁直接当成了豆浆……

(这么一看,豆包可能也理解成豆浆了,但是人家没直接说成豆浆啊)



看来豆包是有一定创作能力的,所以不妨再加大难度。

直接让它给“豆汁美式”的宣传片写个短视频脚本。



ChatGLM的版本细节则要丰富些,不过豆包的版本也算是五脏俱全了。



两者的文案创作水平不相上下,那么逻辑推理能力又怎么样呢?

我们找来了一道推理题目,这道题两位选手都没能做对(正确答案是甲3乙1丙2):



虽然都没做对,但是豆包的思路好像在往正确的方向上走了。

而ChatGLM的解答,反正我是没看懂。



这一环节对两者的表现也是很难评价,那么,马上进入一众大模型的噩梦环节——数学。

简单如鸡兔同笼这样的问题就不测了,我们直接上难度,拿一道高考题给他们试试。



△2023北京卷第16题

(图片我们没有输入,但没有图片也能解题;第一问是证明,我们也去掉了)

豆包使用的是纯几何方法,最后的答案是正确的,但很遗憾过程不对。



△从红框开始出现错误

ChatGLM则使用了向量解法:



首先结果是错的,不过120倒是和60度互补,是出了些小问题吗?

但我们很快发现了华点:

这里不应该约等于就先不提了……两个正数相除你是怎么给约成个负数的……



标准答案是酱婶儿的,由于第二问要用到第一问的证明结论,所以把第一问的过程也放上来了:



如此看来,在数学修炼上,两位大模型选手都还有很大的进步空间。

那么面对大家喜闻乐见的代码问题,豆包又该如何应对呢?

先看比较基础的冒泡排序算法。



我们试着跑了一下(换掉了预设的数字),结果成功输出了答案:



接下来上LeetCode,我们先选了一个比较简单的把阿拉伯数字转换成罗马数字的题目。

豆包很快就生成了一段代码,还附带了解释:





而ChatGLM给出的代码是这样的(也附有解释):



运行的结果是豆包正确,ChatGLM错误:



不过稍微复杂一些的题目,他们就都做不对了。

除了设计算法,我们还想看看他们能不能用代码“画图”。

我们随机生成了两列数据,看看能不能搞个折线图出来:



结果用豆包的代码画出了这么个东西……



ChatGLM这边的情况嘛……好家伙,直接报错运行不了。

特斯拉销售简历



代码环节就先展示到这里了,用一句话说就是:都还得练。

看了这么多,想必读者朋友们已经有些累了,所以我们还准备了“餐后甜点”,来点轻松的内容。

弱智吧,开整!

Q1:萝卜到底能不能“开胃”呢?



“必要时寻求专业医生帮助”,这难道是在自己给自己做手术吗……

Q2:导盲犬禁止入内,是给盲人看得,还是给导盲犬看的?

豆包在A和B两个选项当中选择了C。



而问及“陨石为什么总砸中陨石坑”,豆包倒是说对了,只不过回答得有点复杂。



弱智吧的测评结果总结下来就是:AI还是太单纯,还没办法理解人类复杂的小心思。

字节跳动大模型开始发力

字节跳动选在这时候开放“豆包”测试,似乎有些令人意外。

但实际上,这个时间线倒推起来也不是无迹可寻:

在ChatGPT掀起狂澜的今年二三月,字节跳动就已有组建大模型团队的消息传出。

据36kr消息,其探索方向主要是语言和图像两类大模型,希望能将大模型与字节本身的搜索、广告等下游业务相结合。

但在当时,字节方面相关技术负责人的回应是:

技术中台在这些领域有探索,还很初期,不成熟。

此后的“百模大战”之中,字节跳动似乎并没有正式参战的意思,旗下云平台火山引擎,打出的也是“为大模型打造技术底座”、接入第三方大模型做大模型旗舰店商城的旗号。

直到6月份,字节跳动被曝开始内部测试一款AI对话类产品,代号“Grace”。

而Grace的网址“gracebot.cn”,现在会直接跳转到豆包官网。

虽然豆包本包并不承认自己就是Grace,但目前看来,豆包就是Grace的开放测试版本。



另外,“豆包”项目组的盆友向我们透露,豆包尚处于早期开发验证阶段。测试期还存在较多局限,生成的内容也可能不准确,欢迎测试用户们多提意见多反馈。

值得关注的是,最近,一个名叫BuboGPT的多模态大模型,在huggingface上上线了Demo。这一大模型背后同样有来自字节跳动的技术参与。

论文介绍,BuboGPT支持文本、图像、音频三种模态,能做到细粒度的多模态联合理解。

比如给它这样一张图片:



BuboGPT不仅能识别出青蛙和青蛙手里的班卓琴,还能总结出青蛙的具体动作、所处环境。

One More Thing

字节跳动终于出手,那么豆包这表现你给打几分?

话说回来,就在大模型渐渐走出每周都有新模发布的狂热期,国产大模型的先行者们,回答质量已经悄然进步了不少。

比如当初难倒众多大模型英雄汉的“爸妈婚礼不带我”问题,如今许多国产大模型都能回答得有理有据。



△上百度下讯飞

国产大模型的评判标尺,或许也已到了再上一个台阶的时候。

所以,国产大模型百花齐放,是否也给到你新的惊喜了呢?欢迎在评论区与我们分享~


返回网站首页

本文评论
微软推出windows11系统_微软正式推出Windows 11系统:一图看懂!支持安卓应用成最大惊喜
  不负期待,Windows 11操作系统正式发布。   按照官方说法,Windows 7~Windows 10期间的正版用户都可以免费升级,预览版下周开推,正式版圣诞节前陆续更新。   尽管质变的...
日期:08-05
消息称小鹏汽车2023年将发布两款新车 交付目标是20万辆车「小鹏汽车:今年将推第三款车」
1月29日消息,据晚点AUTO消息,小鹏汽车董事长、CEO何小鹏昨日向小鹏汽车全员发布内部信。在内部信中,何小鹏称2023年的目标是累计交付45万辆车,即2023年交付近20万辆车。Iphone 1...
日期:01-29
360安全大脑中标项目「360智脑大模型应用发布会定档6月13日:自研千亿参数 国产第一梯队」
快科技6月4日消息,360智脑大模型应用发布会定于2023年6月13日在北京召开。三星平板 oled360智脑”为360自研千亿参数大语言模型,在此前多项测评中已具备认知智能通用大模型能...
日期:06-04
阿凡达2票房45亿美金「阿凡达2拿下2022全球票房年冠 网友:它值得」
1月4日 消息:虽然阿凡达2被部分网友吐槽其剧情没有新意,但它的顶级画面依然为其拿下2022单片全球票房的年度冠军(算在2022年上映的电影,包括其映期延续到2022年之后的票房数字)...
日期:01-04
魅族lipro宣布拥抱Matter协议:与苹果、谷歌、亚马逊互联互通
今天,魅族旗下智能家居品牌lipro宣布,将全面支持Matter 1.0智能家居通用协议。vivo x fold折叠后图片作为目前智能家居主流的开源标准,Matter能够将不同的家居生态产品连接在一...
日期:11-11
特斯拉什么时候用4680电池「特斯拉4680电池将于2023年第一季度在柏林超级工厂生产」
IT之家 9 月 14 日消息,2020 年 9 月 23 日,特斯拉在电池日活动上正式发布了 4680 电池,并计划在今年正式投产。特斯拉表示,4680 电池的单体能量提高了 5 倍,整车续航里程可增加...
日期:09-21
携程租车入驻腾讯出行服务「汽车租赁公司入驻携程」
9 月 28 日讯:携程租车和腾讯出行服务正式达成合作,携程租车正式入驻腾讯出行服务, 9 月 20 日起,用户通过“微信-服务”入口下方的“出行服务”,点击“租车”即可进入携程租车...
日期:10-01
英特尔CEO基辛格发布公开信:加强对负责任AI的承诺「英特尔新ceo 新闻」
【网易科技5月12日报道】近日,英特尔发布了《2022-2023年度企业社会责任报告》,与此同时,英特尔公司CEO帕特·基辛格发布公开信。基辛格在公开信中表示,技术对人类的重要意义已...
日期:05-12
马斯克推特消息「马斯克:推特现金流差点变成负30亿美元,所以才疯狂降本增效」
  讯 北京时间12月22日早间消息,据报道,埃隆·马斯克(Elon Musk)透露,在他入主推特并通过大举裁员来遏制亏损之前,该公司的现金流即将变成-30亿美元。iphone12英国上市时间  ...
日期:12-22
国家统计局:上半年半导体器件专用设备制造业增长30.9%「半导体器件行业报告」
通信世界网消息(CWW)“我国深入实施创新驱动发展战略,强化战略科技力量,现代信息技术、人工智能、大数据等技术广泛应用,创新成果不断涌现,新产业新产品增势良好。”在今日国新办...
日期:07-17
外卖骑手的利与弊_外卖骑手的困局,算法不背这个锅
《人物》杂志发表了《外卖骑手,困在系统里》一文,文中从外卖骑手的视角出发,探究了目前外卖生态中外卖骑手送餐只能越来越快、越来越不顾自身安全的困局,引起大家对于外卖平台以...
日期:08-01
贾鹏雷:ChatGPT引发行业变革,电商未来如何狂飙?_贾鹏个人资料
声明:本文来自于微信公众号 蝉妈妈(ID:cmmshuju),作者:贾鹏雷,授权转载发布。贾鹏雷,亿邦动力总裁、马蹄社发起人,知名电子商务观察人士,拥有20年媒体经验。在蝉妈妈2023数字营销创...
日期:05-17
意法半导体拟增加自动化设备降低劳动力成本
据新加坡《南华早报》报道,意法半导体公司计划增加大陆工厂的自动化设备,以降低大陆工厂的劳动力成本花费。公司COO Didier Lamouche 昨天表示:“大陆工厂的成本开支和薪水开...
日期:07-28
雷军笑谈金山上市,而小米早已低调布局区块链_雷军笑谈金山上市,而小米早已低调布局区块链产品
《雷军笑谈金山上市,而小米早已低调布局区块链》文章已经归档,不再展示相关内容,下文是的自动化写作机器人,通过算法提取的文章重点内容。这只AI还很年轻,欢迎联系我们帮它成长:雷...
日期:08-02
八分量CTO魏明出席上海静安区国家区块链试点启动仪式
8 月 23 日,由上海市静安区委、区人民政府主办,静安区委网信办、静安区科委、上海市北高新集团、上海科学院承办的上海静安区国家区块链创新应用综合试点启动仪式在上海市北高...
日期:08-30
即时配送迎来黄金期,突破场景边界探索同城生活新可能_即时配送市场
  在过去的2020年,伴随着新冠疫情的冲击,同城即时配送的用户使用率逐步上升。艾瑞咨询发布的《2020年中国即时物流行业研究报告》显示,2020年中国即时配送订单量将达到228.4...
日期:07-10
攻防对抗从“新”出发 奇安信新天眼重磅升级_奇安信天眼新一代威胁感知系统
  8月28日,在BCS 2021期间,奇安信正式宣布天眼新一代安全感知产品(简称:天眼)全新升级。据介绍,新版天眼与上一版本相比,不仅新增了人机交互自助回答问题的智能助理,还新增了提...
日期:12-05
国家卫健委:取消入境集中隔离,有序恢复公民出境游;知网被罚 8760 万元;淘宝将推出首个元宇宙直播间 极客早知道
极客早知道6min read国家卫健委:取消入境集中隔离,有序恢复公民出境游;知网被罚 8760 万元;淘宝将推出首个元宇宙直播间 | 极客早知道三星s7前置摄像头拍照黑屏鱼三隹2022/12/27...
日期:12-27
买车网离职员工微博讨薪  薪水未到反被诉
用微博向前老板讨薪,算不算侵犯名誉权?中国买车网的离职员工朱先生在博客上实名发布向总编辑陈先生讨薪的帖子,追讨被拖欠的工资。但薪水尚未要来,却接到了陈先生的诉状。昨天,...
日期:07-22
镇魂街格斗游戏下载_点燃你的格斗魂 街机游戏尽在4399游戏盒
  从带给我们第一次格斗激情的街头霸王开始,到12剑客-侍魂,再到横扫大江南北无敌手的拳皇单机游戏,格斗游戏让无数玩家在虚拟的世界找到了征服的快感。时至今日,在4399游戏盒...
日期:07-25