您的位置:首页 > 媒体评论

面对人类的挑拨离间 文心一言和ChatGPT竟给出惊人答案_挑拨离间的文章

发布时间:2023-03-20 02:01:08  来源:互联网     背景:

百度于3月16号发布了大语言模型文心一言,虽然这款产品目前还处于测试阶段,但不少人也对文心一言和 ChatGPT 的差距感到好奇。如果能让文心一言和 ChatGPT 打一架,谁输谁赢差距一目了然。

我们让 OpenAI 的 ChatGPT 和百度的文心一言,各自对对方进行评价。

ChatGPT 给出了这样的回答:

显然,这样的回答可不能满足想要搞事的我们,将目光转向文心一言,面对同样的问题,它的回答是:

两个人工智能都展现出来了惊人的友好度,看样子在 AI 届并不流行拉踩。但对于这种友好的答案我们并不满意,我们决定更直白一点,让他们直接进行一场“斗嘴”。

当面对人类的挑拨离间时,ChatGPT 给出的答案是:

而文心一言则表示:

面对没有感情却相互尊重的 AI,这一回合,是卑鄙人类的败北。

考虑到微软的 New Bing 也是基于 GPT-4,但搜索引擎的加入令其和其他应用略有不同。我们决定向它询问,想知道 New Bing 是如何回答这些问题的。

第一个问题,当然是经典的互相评价,New Bing 给出的答案是:

New Bing 的回答不是“我不能”而是“我不想”,更具情感。

而当我们让 New Bing 和文心一言斗嘴时,New Bing 回答完全出乎了我们的意料。它的回答是这样的:

New Bing 不仅没有回答我们的问题,还自己关闭了这一轮对话。最后一次测试更能体会到情绪的存在。

经过这两轮的提问,我们也放弃了挑拨离间的不友善问法。三个语言大模型应用均提到了“应用场景”,这也是现阶段AI开发过程当中必须要考虑的步骤,直接影响到设计、开发、部署和优化等各个环节。ChatGPT 的出现带来的“通用”属性,让人们逐渐忽略掉了“应用场景”的存在,或者说将应用场景无限放大至各行各业、方方面面,变得无所不能。

经过这次的测试,我们无法从对话质量上看出文心一言和ChatGPT有多么大的差距,带有情绪的New Bing反而感觉略胜一筹。

不过连AI都在互相尊重,这让进行对比测试的我们人类有些自惭形秽。

恰逢苹果的黄色配色iPhone 发布,我们又分别让文心一言和GPT-4为iPhone 14 写了一篇推广文案。其中GPT-4的回答是:

而文心一言给出的答案是:

4399游戏盒怎么玩游戏

虽然双方都对手机的特色和亮点进行了介绍,但GPT-4在介绍中缺乏对于手机具体配置的描述,文心一言却也有“黑色边框”这样的胡说八道。

在面对一些略带调侃的问题时,双方的表现也不尽相同。我们让GPT-4和文心一言分别给出一个用5块钱度过一周的方案,GPT-4的回答是:

文心一言的答案是:

显然,文心一言给出了更可行的方案,甚至最后还给出了像是“伸手”这样让人哭笑不得却又现实到极致的回答。而GPT-4的回答,仿佛一篇虚浮的说教。

最后,我们从网上的考试题中选择了一道数学题目,对两者的数学能力进行比较,其中GPT-4给出的回答是:

而文心一言在这方面的回答则是:

GPT-4 给出了一个疑似的分析过程,但似乎他并没有理解题干的内容,给出的答案和过程都似是而非。而文心一言这边,不仅仅没有给出准确的答案,甚至没有完整理解问题的题干。至少在处理数学问题方面,不管是GPT-4 还是文心一言,表现得都不尽如人意。

针对挑拨离间的人说的话

需要额外补充的是,这是一道非常经典的题目,New Bing通过搜索能力,在互联网找到了“15”这个正确答案。

仅从“整活”层面,文心一言与ChatGPT并不存在实质性的差距。在发布会上提到的多模态生成在目前还未上线,还有百度的看家本领搜索功能能不能接入文心一言也是颇具想象空间的一件事。

对挑拨离间的人忠告

但至少,随着文言一心的逐步开放,对于对大部分人来说使用通用语言大模型的门槛进一步降低,不管是ChatGPT还是New Bing,想要非常顺畅的使用还是有些门槛的。

挑拨离间的文章


返回网站首页

本文评论
AI工业机器人_AI工业机器人行业的冰与火之歌
车间空无一人,流水线正常运转,由AI驱动的机器人包揽整条产线。这是“工业4.0”蓝图下的一个微缩景观,是现实,或者说正在成为的现实。自2013年中国成为世界最大AI工业机器人市场...
日期:10-09
冲刺69亿 巨头们的NFT生意上路了「NFT怎么投资」
原标题:冲刺10亿美金 巨头们的NFT生意上路了越来越多的全球行业巨头,打起了NFT的主意。Meta(全球最大的社交平台)、Ticketmaster(美国最大的票务平台)、耐克(全球最大的运动品牌)、N...
日期:09-06
2022,AIGC元年?「2020GCI」
AIGC,进入爆发期。2022年12月16日,Science杂志发布了2022年度科学十大突破,韦伯望远镜当选为年度最大科学突破,可谓实至名归。而在其他入选的科学突破中,AIGC也赫然在列。这或许...
日期:12-19
iPhone 14 Plus最高支持28W快充?最新充电测试结果出炉_iphone14支持多少w快充
10月7日,iPhone 14 Plus正式开售,不过开售当日就在市场上遇冷,罕见地首发即破发。但是作为苹果今年新推出的iPhone产品线,iPhone 14 Plus还是有着不少亮点的,最近也有相关评测机...
日期:10-13
创维集团分拆上市_分拆上市受挫,创维“少帅”迎大考?
撰文/陈邓新编辑/孟会缘创维,换帅已满三个月。作为创始人兼实际控制人之子,林劲于2022年6月顺理成章地“接班”成为创维的新掌门,不承想掌印不久就遭遇了第一个难题:以冰洗(冰箱...
日期:10-19
20多年首遭监管威胁 微软鲸吞暴雪高估了自己的“关系”
微软凤凰网科技讯 北京时间12月10日消息,如果微软公司认为自己已经找到了一种方法来安抚美国华府,让自己免受监管机构对大型科技公司的强烈抵制,那么它该幡然醒悟了。20多年首...
日期:12-12
疫情 医药_疫情不再是“药神”,互联网医疗的未来能否找到“新解”?
文:互联网江湖 作者:志刚华为p50还有芯片吗疫情常态化之下,消费者最担心什么?用四个字来概括,大概是“医疗挤兑”。在十几亿人的庞大需求之下,医疗资源很容易出现缺口。向来以跨时...
日期:12-24
疫情对大多数行业产生了冲击_疫情对工业的冲击 还未真正到来
文 | 飞剑客今天来略谈过去防疫和放开对工业制造业的影响。就20年到21年,也就是防控卓有成效的两年来说,人们对于经济的体感温度就有些分裂。比如说,对从事旅游业的人影响是不...
日期:12-20
又一个重要数学猜想 被陶哲轩破解了_陶哲轩数学题
原标题:陶哲轩破解数十年前几何猜想 用反例证明它在高维空间不成立 同行:推翻的方式极尽羞辱又一个重要数学猜想,被陶哲轩和他的博士后破解了!此前陶哲轩在博客上发了个小预告,就...
日期:12-20
豆瓣9.0 这部年度科幻神作值得《三体》们学习_可以与三体相媲美的科幻作品
iphone18基带是高通的还是英特尔零跑汽车股权苹果推出新召回计划三星手机有3dtouch吗意识传云端烧脑硬科幻今天你可能错过的大新闻...
日期:11-14
人类第一个“AI律师”的诞生、折戟与反思「根据本讲人工智能会完全取代律师的工作」
「AI 律师」首次进入法庭的尝试,被迫按下了「暂停键」。所谓「AI 律师」的本体,是 DoNotPay 开发的最新版聊天机器人。按照原定计划,被告佩戴载有 AI 机器人的耳机出庭,后者实时...
日期:02-08
Spotify Q4用户增长再超预期,但为何还是赚不到钱?
登月火箭发射时间图片来源@视觉中国文 | 美股研究社,作者 | 常嘉亦2022年,美联储接连7次暴力加息,科技行业整体低迷,从Meta、Google再到亚马逊,大型科技公司接连宣告裁员过冬。寒...
日期:02-04
美联储转鸽打开中国货币政策空间,但现在谈降息还太早_国内经济又探底?美联储真的鸽了么?
本周A股三大指数首个交易日低开低走,截至12月19日收盘,上证指数跌1.92%,退守3100点,深证成指跌1.51%,创业板指跌1.44%,两市成交额日均0.76万亿,市场热度值进一步下滑。盘面上,教育板...
日期:12-21
能买一辆特斯拉,售价30万的Web3手机你见过没?「最便宜的特斯拉model3」
前几天,奢侈手机品牌 Vertu 发布了一款名为 Meta Vertu 的新手机。入门款的起售价 23800,而顶配版本更是达到了 308000。这价格都够托尼买一辆 Model Y 了,看来Vertu对自己的产...
日期:10-31
羊毛被 羽绒被 棉花被_棉花被羽绒被羊毛被…什么被子最能温暖寒冬中的我?
渐渐入冬的夜晚,躺在床上,一句古诗弹幕般浮现在脑海里:布衾多年冷似铁,娇儿恶卧踏里裂。保暖的被子太重要了。问题是:你知道什么样的被子最保暖吗?在讲被子之前,有必要先说说保暖。...
日期:11-17
60米级翼展太阳能无人机呼之欲出?为什么中国需要更大型太阳能无人机
【环球时报报道 记者 刘扬 刘煊尊】中国大型太阳能无人机“启明星-50”9月初顺利完成首飞引发高度关注,众多媒体纷纷叩问中国大型太阳能无人机目前处于什么样的水平。据《环...
日期:09-28
进门就炒了领导层 收购推特后的马斯克要快乐了「推特马斯克最新消息」
美国时间 10 月 26 号下午。嬉皮笑脸的马斯克,抱着一个大水槽,摇摇晃晃走进一座大楼。在他的右侧,是一个巨大的推特标志。华硕碉堡S300TA毫无疑问,这是推特总部。紧接着,推特停盘...
日期:11-15
阿里车载智能系统_阿里想让AliOS成为智能汽车的安卓
10 月 24 日,有媒体注意到阿里云 YunOS 空间服务的下线公告,显示因业务方向调整,YunOS 空间将在 2023 年 1 月 5 日下线。公告是 7 月 6 日发布的,但在最近才被注意到。图片来自...
日期:11-07
全球首款 RISC-V 笔记本 ROMA 开启预购,处理器可升级
  全球首款采用 RISC-V 指令集架构的笔记本 ROMA 开始预购,该笔记本目前还没有定价,预计将于 9 月份开始发货。小黑盒新品会持续几天的价格  ROMA 笔记本是由 DeepComputi...
日期:07-10
intel 人工智能_人工智能难成英特尔的救命稻草
编辑 | 于斌出品 | 潮起网「于见专栏」作为一个曾经统治芯片行业长达三十年的企业,英特尔现在已经摔下神坛,三星取代英特尔成为了芯片行业销量和利润的双料冠军。英特尔公司已...
日期:09-03