您的位置:首页 > 互联网

网盘用上大模型后「真香」!压箱底黑照3秒找到,亲朋好友都不淡定了

发布时间:2023-07-18 02:16:11  来源:互联网     背景:

声明:本文来自于微信公众号量子位(ID:QbitAI)作者:明敏 萧箫,授权转载发布。

想不到,有了AI加持,我也有在我司鲨疯的一天!

同事的压箱底黑照,被我3秒钟就翻了出来,光速做成表情包先发制人。

图片

喏,只需要在网盘的搜索框里输入“大笑的男人”,立马就能检索到相关图像。

QQ截图20230717163013.jpg

然后选中想要“攻击”的对象、点击编辑,就能一键加文字变表情包。

整个过程相当丝滑,我图都做完了,同事那还在找图呢(doge)。

而且这个搜索还能直接理解“什么是表情包”,可以一键找到之前做好的图。

图片

咱就是说,在堆满陈年老照片和资料的网盘里用上精准搜索,斗图大王舍我其谁。

除了照片,它甚至还能直接搜同事的视频、或识别表情包中的文字,搜索灵活度很高。

所以,这个功能究竟在哪里开启,相比传统相册搜索又有啥不一样的地方?

典藏表情包搜索“神器”

首先,在百度网盘里启用这个智能搜索功能。

打开网盘搜索框,输入“高级图片搜索”,就会显示一个功能入口,进入后点击“立即体验”并等数据升级完成,系统就会发送通知,可以上手开玩了~

图片

启用高级图片搜索功能后,在网盘主页的搜索框里就能一键搜图,不用再特意进入某个工具中。

图片

怎么搜?“脑子里想啥就搜啥”。

以搜索单个词汇为例,比如“比耶”和“挤眉弄眼”这种模糊的表达,智能搜索就秒懂:

图片

像“修狗”这样的网络热词,也在它的掌握之中。

图片

甚至还进化出了自己的“偏见”,比如和“发布会”关联的往往是“PPT”(doge):

图片

不止是单个复杂词汇或形容词,搜图时还可以直接说一整句描述,甚至加多个限定词

同时,随着输入的细节增加,它的搜索结果还会实时调整

比如只输入“睡觉的”,可以看到系统找到的第一张照片,是一张猫猫躺着的表情包。

图片

但随着关键词完善到“睡觉的”以后,这张猫片就马上被系统筛了出去。

图片

除了准确把握图片精髓外,这个智能搜索还能识别图片中的文字,搜索结果也很全面。

比如搜“绷不住了”,它不仅能给出图文完全一致的表情包,还会放出其他相似图片:

图片

搜索范围上,不止是找图,这个功能就连视频也能搜。

图片

总之,网盘的智慧搜索新功能,让找照片、视频等文件不再是个费力的“提示词工程”。

要想搜到自己的照片,只用和网盘“聊聊天”就行,它就能像人一样准确get你要找的那张照片。

所以,这个功能究竟是怎么实现的?我们扒了扒背后的技术原理,发现还真没那么简单。

路由器200元价位的怎么选

背后果然用上了大模型

智慧搜索,本质上有点像一个自带图片+视频智能查找功能的“私人定制版”网盘搜索引擎。

但为了实现这个功能,百度网盘团队甚至连大模型都用上了,核心目的,在于解决传统图片搜索的四大问题——

搜不到、搜不准、搜不快、搜索方式单一。

首先要解决的、也是最大的难点之一,是“搜不到”的问题。

传统按标签搜索的相册,内置搜索引擎没有真正将图片和文字之间的“含义”关联起来,换言之就是“文不对图”。

普通手机的标签式搜索

为了解决这一问题,团队选用了百度文心的多模态大模型VIMER-ViLP,并用海量图片和文本数据对它进行了训练,来实现基于向量的语义搜索

这类方法的核心原理,是将文本和图像的特征向量映射到同一个语义向量空间,向量之间距离越近,相似度就越高,同时也能避免语义丢失,降低“搜不到”的概率。

图片

相比CLIP,VIMER-ViLP在训练时采用的中文数据更多,因此搜特殊中文名词也会更准确。例如,在博物馆内拍摄的文物“中华第一龙”:

图片

不过,虽然大模型能增强图片的理解能力,但面对地点、时间、人名这类涉及照片拍摄的信息,它就无能为力了。

接下来,还需要结合照片本身的信息,解决“搜不准”的问题。

传统标签式搜索,需要精准到具体日期(年月日)和拍摄经纬度等照片拍摄数据,但用户输入的搜索词往往比较模糊。

为此,团队基于语义理解实现了组合查询,也就是用AI将输入文本和照片拍摄数据进行对应,相当于做了个翻译。例如输入“前年”,语义理解就会自动提供2021年拍摄的所有照片。

甚至更精细的某个具体地名,如“西单”也没问题,还能将搜索范围精准到“照片”,筛掉不想搜的资料:

图片

准确度被解决后,就是这类智能搜索“搜不快”、成本高的问题了。

毕竟,光是给已有图片建立索引就能让手机算力爆炸,更别提还有新增图片后重建索引、查询期间使用大模型的成本。

因此在索引上,团队设计了一套端云融合的语义检索系统。首先用云端算力进行向量计算,再用终端设备部署本地索引并检索,这样既能降低终端计算量,又确保了搜索的速度;

图片

为了进一步降低终端耗电量,团队还对索引格式进行了压缩优化,确保搜索时搜的是图片中最“精华”的数据。

算力上,团队还开发了一套统一管理CPU、GPU等异构资源的调度系统,充分利用“闲置”资源来计算云盘上的数据。

这样一来,即使你的网盘中珍藏了10万张照片,搜索用时也在毫秒级——不到1秒就能找到想要的图像。

解决了这三个问题,最后就是“锦上添花”,让搜索方式更加多样化了。

例如,网盘团队还引入了以图搜图、OCR和视频检索等AI技术。

以图搜图可以直接上传图片,通过对比照片内容,来查找网盘内或是全网的相似图片:

图片

甚至还能连接百度百科:

OCR识别则可以通过AI识别图片中的信息和知识,即使是标点符号很狂乱的图片也OK:

极米投影仪NEW Z6X

图片

至于视频检索技术,则是通过AI算法,先快速筛选出最能代表视频的一张封面图,以加速视频搜索。

放逐之刃出装顺序图

据了解,图搜功能在百度网盘已经覆盖千万级用户,一年累计图片搜索服务超过2.5亿次。即使在如此大的数据量下,百度网盘始终将用户数据安全及隐私保护放在首位。

以存储安全为例,百度网盘依托百度云计算(阳泉)中心,数据可靠性高达99.9999999999%(12个9),极大提升了用户数据稳定性和可靠性。同时,也持续通过三项ISO安全认证的年度审核,全方位保障每位用户的数据安全。

总结来看,百度网盘正是通过包括大模型等前沿技术来实现了核心功能的“进化”,从而在一众相似APP中脱颖而出。

图片

但为何大模型率先引发变革的领域,会是百度网盘这样的APP?

大模型正在重写所有应用

其实不止是百度网盘,市面上已经有不少应用开始吸纳大模型这样的新技术。

但无论从产品技术、行业,还是百度自身来看,网盘都必须是率先发力大模型的一个“立足点”。

产品本身来看,网盘作为一个管理海量数据的在线存储数据库,必然和Excel等数据处理软件一样,面临着更智能的交互方式需求。

正如一句话自动做图成为Excel的刚需一样,一句话“搜图”也必然成为用户使用数据库的刚需。

大模型的出现,直接在文本和图片之间架设了一座桥梁,使得网盘不再只是一个“硬盘”,而真正成为了用户的“第二大脑”。

行业发展趋势来看,搜索本身也会成为大模型最先落地的领域。

包括谷歌AI snapshot和百度“AI伙伴”在内,国内外在线搜索引擎都已经迅速引入大模型能力。

但除了搜索外部知识以外,无论是网盘这样的内部数据库搜索、还是移动端本机搜索,对于智能数据搜索同样有着极大需求。谁能率先将智能搜索技术引入产品,谁就能率先改善用户体验、吸引更多人使用产品。

最后从百度本身来看,在大模型最初火热之时,CEO李彦宏就留下过名言:

要用大模型把所有应用重做一遍。

而网盘APP,正是百度最先拿出来、最有竞争力的大模型产品之一,其所变革的功能也不仅仅停留在智能搜索层面。

换而言之,智能搜图、搜视频,还只是百度网盘变革的开始。如今在大模型加持下,网盘具备的AI和数据处理能力被彻底激发出来,彻底成为用户的智能助理

它以大模型为核心大脑,通过调用知识、AI模型和API们,能快速实现个人知识管理,马上还将实现多模态创作和多设备互联互通——

  • 个人知识管理:包括搜索在内,对网盘数据进行全方位智能管理。如对英文财报进行快速总结、依据文件中的资料回答问题、与用户互动等。

  • 多模态创作:网盘内的图文视频内容,都已经能用AI实现再创作。如图片自动转视频、视频字幕自动转文本等。

  • 多设备互联互通:基于IoT,迅速将网盘内容在多个智能设备上互联互通,传输文件非常方便。

这个智能助理,正是网盘前不久开启内测的“云一朵”,有了它,找图、摘要、翻译等能力,都是一句话的事儿。

从智能搜索到百度网盘“云一朵”,被大模型“重写”的百度网盘,已经率先走在了行业变革的前列。

感兴趣的童鞋可以去体验下啦~


返回网站首页

本文评论
名爵6超车失败撞上Model 3:“让特斯拉超车先行”标语引人发笑
特斯拉又出事故”了,不过这次特斯拉是受害者。从博主发布的行车记录仪视频来看,一台特斯拉Model3正常行驶在路上,不多时从后方驶来了一台MG6,MG6的车速相当快,也许是看到了特斯拉...
日期:11-18
口碑长城后继续凡尔赛 荣耀X20竟然请了千万个代言人
  这是千万个“我选择,我相信”的故事,这是每一位用户众口交荐的心声,这是荣耀X系列八年历练成就的千万之选。这个夏天,荣耀X系列用千万用户的真实体验,铸造了一座独一无二的...
日期:07-17
红杉中国宣布成立创业加速器YUÈ 沈南鹏带队服务天使轮到A轮
讯 8月15日上午消息,红杉中国宣布成立创业加速器YUÈ,为处于天使轮到A轮的中国创业者提供红杉独家研发的体系化创业课程和资源服务。   据了解,YUÈ的定位为“中国创业者的第...
日期:08-16
测体温、发口罩、高考距离办公……复工第一天 云集员工很安心
  关闭中央空调、进园区测体温、开工必戴口罩、座位不相邻……2月17日,本部位于杭州市的云集正式恢复现场办公。作为杭州市有序复工第一批备案企业,云集依照杭州市相关规定...
日期:04-15
海信聚好看发布春节电影TOP榜:一半为喜剧_海信电视的聚好看
  对于爱电影的人来说,在今年这个没有院线电影的春节档,宅在家里看电影,就成了唯一的选择。近日,海信聚好看发布的春节档电影TOP10榜单显示,半数均为喜剧电影,这既是延续了历来...
日期:06-10
宏碁掠夺者存储受邀参加2023微星龙盾局 将携Hermes DDR5新品内存亮相_宏碁掠夺者固态硬盘怎么样
2023 年的夏天,微星龙盾局嘉年华活动再次启程,首场线下交流会将于 7 月 1 日在花城广州正式拉开帷幕!宏碁掠夺者Predator作为现场唯 一内存品牌受邀参与活动,将与主办方一起为...
日期:06-30
多普达手机大全_多普达手机大全下载
多普达手机大全多普达是一家来自台湾的知名手机品牌,成立于1997年,是全球领先的移动通讯设备供应商之一。作为全球前三大PDA品牌之一,多普达的手机系列自问世以来一直备受消费...
日期:05-31
58集团 x DorisDB:全面升级数据分析能力,满足多场景业务分析需求
  58集团是中国互联网生活服务领域的领导者,旗下有国内最大的生活服务平台,覆盖各类业务场景,例如车业务、房产业务、本地服务、招聘业务、金融业务等等。   随着业务的高...
日期:03-18
《博德之门3》Xbox版遭遇技术难题「博德之门3主机版」
众所周知,本世代Xbox由XSX与XSS构成高低搭配组合微软想得很美,高价XSX与PS5争夺核心玩家,低价XSS主打入门级市场,双机携手高低通吃。开发商可就惨了,要为Xbox平台准备两个版本,大...
日期:02-25
三星galaxy z flip 折叠屏手机「造型绝了!曝三星Galaxy Z Flip 5折叠屏将采用“文件夹”形状副屏」
三星正在开发新一代的 Galaxy Z Fold 5 和 Galaxy Z Flip 5 折叠屏手机,其中 Galaxy Z Flip 5 将带来更大的副屏和新设计。据了解,该机将采用“文件夹”形状的外屏,并且是异形...
日期:05-01
科旭威尔科视星®,引领视听新潮流
随着信息技术和科技的发展,摄像技术也不断发生着更迭,特别是在节目录制、舞台活动、演播室录像等方面,融入了AI、5G、超高清、大数据等技术的智能拍摄,逐渐取代了人工拍摄,其中,“...
日期:07-17
埃里森持有甲骨文股份_甲骨文CEO埃利森:暂时不会考虑展开新收购
甲骨文首席执行官拉里埃利森(腾讯科技配图)(林靖东)北京时间6月24日消息,据国外媒体报道,甲骨文首席执行官拉里埃利森(Larry Ellison)周四表示,由于年轻的科技公司的股价近期大幅上...
日期:07-30
新能源车所用的典型材料「我国新能源汽车用高等级材料获突破」
IT之家 9 月 1 日消息,据央视新闻,由我国自主研发建设的高等级无取向电工钢生产线已于 8 月 31 日在河北迁安投产,新材料将大幅提升新能源汽车电机功率密度和电机效率。linkedi...
日期:09-27
2021第九届消费者体验创新大会_2021CTIS消费者科技及创新展览会圆满闭幕
  2021年6月25 日(中国,上海)2021年6月11日, CTIS 2021首届消费者科技及创新展览会在上海新国际博览中心圆满落幕。展会以“科创新格局 共赢双循环”为主题,聚焦“科技、贸易...
日期:01-08
少年的力量:百度沸点2019里的中国95后“新风貌”
  “一代人终将老去,但总有人正年轻”,从80后到90后再到95后,社会对年轻一代的成长总是充满了期待。如今,95后人群正逐步走向社会,而这些“新鲜血液”们特有的激情与自信,也让...
日期:04-04
玩赛车游戏 4399游戏盒尽享“速度与激情”_4399小游戏中所有赛车游戏
  追逐、飙车、警匪、黑帮…在最新上映的《速度与激情5》这部影片中,两位驰骋赛车届的主角为了让自己彻底获得自由,组成了一支终极赛车团队,和当地的触目惊心的腐败政府展开...
日期:07-28
戴尔商务笔记本电脑「戴尔商务笔记本电脑性价比排名」
是企业、政府、教育机构等机构和个人常用的电脑。戴尔历史悠久,是全球知名的电脑品牌之一,其商务笔记本电脑拥有出色的性能、耐用性和可靠性,因此备受青睐。的外观设计简洁大方...
日期:05-31
对标顺丰?圆通成立圆准达航空服务公司
2月8日讯,天眼查App显示,2月1日,上海圆准达航空服务有限公司成立,法定代表人王海彪,注册资本500万人民币。经营范围含通用航空服务;国内货物运输代理;航空运输设备销售;技术进出口;民...
日期:02-08
历年双11苹果降价ipad「新款iPad立减600 双11到手只要2099元」
双11促销开始,现在新款iPad立减600元,目前到手只要2099元了。特斯拉家用电池Powerwall这款iPad采用的是苹果A13处理器,搭配64G的存储空间和iPadOS系统日常使用是非常流畅的。三...
日期:11-10
法国球迷请愿重踢世界杯决赛 阿根廷人神回应:“别再哭了”_世界杯法国队对阿根廷
12月19日凌晨,万众瞩目的卡塔尔世界杯决赛,阿根廷对战法国,决赛从常规比赛打到加时、再来到点球大战;最终,来自南美洲的阿根廷队以7:5(点球大战4:2)击败了卫冕冠军法国队,阿根廷队捧起...
日期:12-25