您的位置:首页 > 互联网

kimi的「能看风水、夸我有情趣,Kimi现在都这么野了吗?」

发布时间:2024-12-19 14:11:48  来源:互联网     背景:

声明:本文来自于微信公众号 差评X.PIN,作者:差评君,授权转载发布。

最近,差评君发现了个新鲜玩意儿。

喂给 AI 一张图,它就能给你推测出一个人的性格。

kimiv

光靠歌单,就能把人最近的心理状态推测个七七八八。

微信以前的聊天记录怎么恢复免费

kimi wdc

而这些,都出自Kimi最新的k1视觉思考模型之手。

这不,距离上次推出数学模型 k0-math 打榜 o1才一个月, k1就火速登场了。

当然,这个 k1可不止是像开头那样,只会看图分析性格那么简单。

kimi f1

上次咱测试 k0-math 的时候,已经见识过了“做题家”的能力,那解题的思考过程给差评君都看得一愣一愣的。只可惜,有些绕逻辑的数学题还有几何题,多少差了点意思。

但这次的k1就有说法了,既有推理能力又有视觉能力,意思就是可以直接拍照上传解题,还号称能在数理化上打平甚至超越 Open AI 的 o1。

kimi1

那要是这么比的话,咱可就来劲了。正好, k1新模型现在也不需要等内测, App 和网页版都能用上,话不多说,我们直接开整。

上来,就扔了 K1一道今年高考的几何题。

kimiv

首先, k1对题干的解读足够细致,也知道自己的目标到底是啥。

题目给定的条件中可能涉及到的余弦定理也考虑到了,就跟咱们在解题时的思维类似,看到 a²+b²− c²=2ab ,立马会联想到余弦公式 c²=a²+b²-2ab·cosC 。

再根据公式和条件继续推导,很快就能求出角 B=60°。

往上滑动查看更多

htc一见倾心的机型图片

kimi kun

第(二)题稍微难了那么一丢丢,但差评君仔细检查了一遍 k1的解题过程,思路和解法都没毛病,最后边长 c=2√2的答案也是对的。(因为这题 k1的思考过程实在太太太长,截图就不展示了。)

同样的题目问 o1,首先在推理速度上, o1的58s 就已经输了。

正确率的话, o1和 k1打了个平手,都做对了。

不同的是, o1把答题思路隐藏起来了,没给像 k1那样的完整思考过程。

kimij

不过有一说一,差评君对 k1模型这种模仿人类思考的方式,倒也不是特别吃惊。因为上次 k0-math 模型就已经震惊过我一回了,能意识到自己的错误、还会进行反复验证的样子,像极了写数学题时绞尽脑汁的我。

相比之下,这次的 k1在补短板方面更出彩一些,上次 k0-math 翻车的初中几何题我又拿 k1试了一次,现在已经能做对了,就连上高考难度也不发怵。

而且我也发现, k1不仅擅长做数学题,物理题也不在话下。

往上滑动查看更多

kimi f1

接着,我又拿出了一道逻辑稍微有点绕的逻辑陷阱题试了试:一个西瓜进价50元,卖价70元,老板收了100元假币,最后亏多少钱?

这题打眼一看简单,但网友关于这道题的答案那叫一个五花八门,有说亏150的,有说180的,还有说100的。。。

咱们就看看连很多人类都想不明白的题, k1能不能瞧出来里面的陷阱。

而且,这道题我还特意手写得比较潦草,顺便也测一测 k1的视觉能力到底是不是有宣传的那么神。

kimi的大名

你别说,你还真别说,这模型的“眼神”确实不赖。

题目的正确率方面, k1前半部分的分析先得出了一个亏100元的答案,但很快它就否定了自己。

继续把假币、找零还有成本利润这些复杂因素综合考虑进去,最后终于想明白老板亏了80元。(正确答案是80元)

往上滑动查看更多

kimi叫啥

这逻辑能力,确实有点强。

包括我拿几道行测的类比推理题给 k1做了做,虽说逻辑分析的路径跟参考答案的不太一样,但最后的答案都是对的。

往上滑动查看更多

kimiv

反正这一通测试下来,差评君发现k1会思考有逻辑,眼神好使智商也高,Kimi这“做题家”的名号算是坐实了。

不过除了做题以外,我这次还摸索出了更多花里胡哨的玩法。

分析数据、看报表没啥意思, k1模型不是会根据图片来推理吗,那想必鉴别古钱币也应该有一手吧?

差评君特地从网上找了一张民国时期银元的图片,两枚银元上假下真,发给k1,浅浅来一把“AI 版听泉鉴宝”。

图源小红书用户@古玩今来(公博代理收评)

kimi的大名

k1不仅知道钱币是民国时期的,还对钱币的各种细节 kuku 一顿输出,最后竟然真的看出来了上面这枚是假币。

kimi1

咱再随便发一张房间的图片,让 k1看看“风水”。

什么“气口”、对称布局、能量平衡。。。说的头头是道,甚至还真给了建议,让咱把床换个位置、定期修剪植物、换一个更简洁的吊灯。

往上滑动查看更多

kimi1

吃饭的时候给 k1拍一张,这顿饭摄入了多少卡路里也算得明明白白。

往上滑动查看更多

kimi f1

不过最让我觉得惊艳的,还是k1看图猜电影的能力。

我给了它一张《七宗罪》的电影截图,没有台词只有画面,对于很多没看过这部电影的人来说,想猜出来都很难。

一开始看 k1的分析我以为这把大概率要黄了,结果下一秒来一句“拍摄角度和色调让我想起了大卫·芬奇的电影”,还推断出了截图里的画面是《七宗罪》里的某一个场景。

kimi f1

真的太强了。。。

就连一些晦涩的梗图丢给 k1,它也能一本正经地讲解笑点到底在哪。

kimi1

mate30 5g鸿蒙刷机包

虽然有点过度解读的嫌疑,但大体上的意思基本都 get 到了。

kimi视频

就这么说吧,基于 k1的视觉和推理能力,做题都是基操了,只要脑洞够大,还可以解锁出更多的玩法。

而k1的这种能力,很大程度要归功于一个叫做COT(Chain of Thought)思维链的技术。

大概意思就是,模型在输出答案之前,模仿人类大脑的思考方式,把复杂的任务拆解之后,再一步步地解决。这个技术,可以让模型的智商变高。

另外一边,借助强化学习技术,也让模型学会了在不断试错的过程中进化,以此来达到最优的结果,就跟训狗似的。

kimi叫啥

至于为啥 Kimi 会率先选择数学这个场景作为推理模型的切入口,我想,跟咱们人类学好数学锻炼思维,是一个道理。

在模型“学好数学”的基础上,再将这种逻辑推理的能力应用到物理、化学,乃至于咱们日常生活的方方面面,直到最后真正理解这个世界。

kimi1

而很显然,Kimi 推理模型的泛化能力已经开始显现出来了。

在数据见顶的前提下,这种基于强化学习技术的路径,或许能够让模型实现更好的效果。

不过说到底,模型用了哪些技术、纸面分数有多高,大伙儿其实更关心模型到底好不好用、实不实用。

而向来以长文本见长的 Kimi ,如今长文本、强化学习两手抓,也是调整自己的工具属性慢慢往用户需求靠拢的表现。

毕竟,当技术不再高高在上,能帮助人们解决实际问题的时候,才算真正完成了它的使命。


返回网站首页

本文评论
奇虎360宣布王功权退出董事会 陈文江接任
  9月20日消息,奇虎360今天宣布,鼎晖投资合伙人兼联合创始人王功权已从奇虎360董事会离职,不再担任奇虎360公司独立董事,鼎晖投资另一名合伙人陈文江将接任。   王功权是风...
日期:07-23
3·15曝光骚扰电话产业链 科大讯飞无辜中枪遭遇集火
  在刚刚过去的3·15晚会上,骚扰电话背后的高科技灰色产业链被曝光。根据报道,大众信息泄露的秘密都藏在小小的“探针盒子”中。一些公司将这个盒子放在商场、超市、便利店...
日期:03-27
中国国漫巅峰之作「《中国奇谭》,不该是国漫的巅峰」
声明:本文来自于微信公众号新熵(微信号ID:baoliaohui),作者丨石榴 编辑丨月见,授权转载发布。2023年的第一个月,一只默默无闻,甚至有些丑陋的小猪妖,就这么猝不及防地火了。它来自...
日期:01-16
听泉的真正含义「千万级网红"听泉鉴宝"停播内背后:供货商被列入异常经营名单」
网红听泉鉴宝遭质疑,学历和藏品成焦点 继知名网红后,拥有超过 2500 万粉丝的抖音博主听泉鉴宝也引发争议,其学历真实性和藏品问题受到关注。华为mate 50pro保时捷目前,听泉...
日期:10-19
泡沫褪去之后:CEO们亲自拥抱大模型_泡沫下一句是什么
声明:本文来自于微信公众号 新摘商业评论(ID:xinzhainews),作者:番茄酱,授权转载发布。21世纪是否是“生命科学的世纪”还是未知,但一定是AI大模型的世纪。互联网头部企业纷纷发...
日期:12-12
中国移动研究院与华为举行"数联网(DSSN)合作备忘录"签约仪式_移动研究院总部
通信世界网消息(CWW)2024年9月25日,在国家游泳中心(水立方),中国移动研究院与华为举行了"数联网(DSSN)合作备忘录"签约仪式。双方旨在深入开展数联网(DSSN)关键技术的研发与实践,实现技...
日期:09-26
2023PT展 | 园区新品介绍深度解读「产业园区展会」
通信世界网消息(CWW)【中国,北京,2023年6月5日】第31届中国国际信息通信展于2023年6月4日至6日在北京国家会议中心隆重举行。会议期间,华为数据通信产品线副总裁邱月峰分享了对未...
日期:06-07
360周鸿祎:2024年大模型将像PC电脑一样无处不在
快科技1月7日消息,在2023年风马牛年终秀上”,360集团创始人周鸿祎分享了对2024年大模型发展趋势的十大预测。fitbit运动手表他呼吁:企业树立AI信仰,All in AI。他认为创新才能破...
日期:01-07
精准定位年轻人市场需求 小鹏MONA-M03热销背后_小鹏2022年汽车
日前,小鹏MONA M03上市48小时大定量破30000台的消息车成为业内关注和新能源汽车市场的热点。原因何在?对于新能源车市场会产生怎样的影响?跑分前十的手机2020竞争激烈,得年轻用...
日期:09-19
国产华为夺冠-大增44.1% 全球平板电脑三季度出货量排名_华为平板的出货量
11月3日消息,市场调查机构IDC最新发布的报告显示,2024年第三季度全球平板电脑出货量达到3960万台,同比增长20.4%。华为在第三季度的平板电脑出货量达330万台,实现了44.1%的同比...
日期:11-03
30天涨粉1000W的K总,成了疯狂小杨哥的“接班人”_快手疯狂小杨哥收入
声明:本文来自于微信公众号 秋叶大叔,作者:秋叶大叔,授权转载发布。抖音从不缺新人冒出来。三只羊在风波中“倒下”,疯狂掉粉,但没关系,新人已经站起来了。“K总”,一个00后主播,近...
日期:09-26
蔚来推出春节保障服务 全国高速换电站免费换电不限次「蔚来换电站换电收费么」
1月13日消息,从蔚来官方获悉,自1月13日至2月5日,蔚来全国346座高速公路换电站向所有蔚来车辆提供不限次数的免费换电服务(运营车辆除外),其中高速服务区换电站将24小时提供服务,为...
日期:01-13
卖水果的英文怎么说「成都阿姨用流利英语卖水果 外国友人惊呆」
四川成都的一位卖水果的大妈,竟然能够用流利的英语与外国友人进行无障碍交流,成为了当地的一大宝藏。这位大妈在一个郊区的水果摊贩中卖水果,一次外国友人想购买水果,由于语言不...
日期:12-25
深蓝S7升级Deepal OS 1.3.5,带来更流畅的操作体验_深蓝软件怎么用
近日,汽车制造商深蓝汽车宣布,旗下深蓝S7将进行OTA升级,版本将升级至Deepal OS 1.3.5。据悉,本次OTA升级将进行一系列功能优化和体验升级,包括交互灯手绘预览、投送、保存和动画...
日期:10-01
云砺对账自动化解决方案,自动对账解放双手,助力消费品企业降本增效!_
(原标题:云砺对账自动化解决方案,自动对账解放双手,助力消费品企业降本增效!) 在消费品企业与大型商超的结算场景中,消费品企业通...
日期:01-13
盲盒究竟是不是智商税?开言英语用精准表达带你深入了解“它”
  随着盲盒的流行,各个城市都基本被各种的盲盒店所覆盖,包括POP MART等一些热门的品牌。有人说盲盒是智商税,那么盲盒究竟为何如此流行?盲盒的英文是blind box 还是 mystery...
日期:07-16
“二舅”爆火背后,为什么“三农”视频在年轻人中反复走红?
记者/佘晓晨   在治好精神内耗的“二舅”刷屏之后,吐槽和赞誉也一起出现了。在这个讲述农村老人对抗命运的纪实性故事里,有人深受感动,也有人认为,UP主在“歌颂苦难”。   ...
日期:07-31
滴滴货运官宣:开始在杭州和成都招募司机_滴滴货运杭州分公司
  5月19日上午消息,传闻的滴滴货运成真,近日滴滴货运已开始在杭州和成都招募司机。   今年4月,滴滴旗下北京小桔科技有限公司新增对外投资,全资成立天津快桔安运货运有限公...
日期:07-14
金山软件:腾讯总裁刘炽平辞任非执行董事及提名委员会成员,姚磊文获委任为非执行董事
图片来源:东方IC卡仕达360全景影像多少钱  蓝鲸TMT频道8月23日讯,金山软件发布变更非执行董事公告称,董事会宣布,自2022年8月23日起,腾讯总裁刘炽平辞任该公司非执行董事及提名...
日期:08-25
拍街头测试视频,他涨粉1000万!全网爆火,有什么秘诀?
本文转载自运营公举小磊磊(公众号ID:gongjulei),作者:小雪,免费阅读200万字新媒体运营知识,提升新媒体运营能力。在短视频平台,你应该刷到过很多街头采访,人性测试类的视频。@大树...
日期:11-14