您的位置:首页 > 互联网

零一万物向量数据库新突破_笛卡尔(Descartes)获六项第一

发布时间:2024-03-11 16:30:16  来源:互联网     背景:

【】3月11日消息,在国际权威评测平台ANN-Benchmarks离线测试中,零一万物笛卡尔(Descartes)向量数据库登顶 6份数据集评测第一名。

“笛卡尔(Descartes)”是零一万物研发出的基于全导航图的新型向量数据库,是能影响大模型性能表现的基础设施;ANN-Benchmarks是当下业界最权威的向量数据库性能测试工具,它可以展示不同算法在不同真实数据集下的表现。

2017苹果手表

笛卡尔(Descartes)首次亮相ANN-Benchmarks评测榜单即包揽了六项第一,最高领先原榜单第一名286%。

零一万物表示,笛卡尔向量数据库目前聚焦于高性能向量数据库。笛卡尔向量数据库将用在近期即将正式亮相的AI产品中,未来也将结合工具提供给开发者。

六项第一

ANN-Benchmarks公布的6份评测数据集涵盖glove-25-angular、glove-100-angular、sift-128-euclidean、nytimes-256-angular、fashion-mnist-784-euclidean、gist-960-euclidean六大数据集。

联发科helio p60

如下图,横坐标代表召回、纵坐标代表QPS(每秒内处理的请求数),曲线位置越偏右上角意味着算法性能越好,零一万物笛卡尔向量数据库在6项数据集评测中都处于最高位。

图注:截至3月10日,ANN-Benchmarks6项评测中,零一万物笛卡尔(Descartes)向量数据库均居第一

“吞吐量 QPS” 是衡量信息检索系统(例如搜索引擎或数据库)查询处理能力的重要指标。在原榜单TOP1基础上,零一万物笛卡尔向量数据库实现了显著性能提升,部分数据集上的性能提升超过2倍以上,在gist-960-euclidean数据集维度更大幅领先榜单原TOP1 286%。

笛卡尔(Descartes)背后技术

向量数据库,又被称为AI时代的信息检索技术,是检索增强生成(Retrieval-Augmented Generation, RAG)内核技术之一。

大模型时代,图片、视频、自然语言等多模态的非结构化数据量陡增,区别于用来处理结构化数据的传统数据库,向量数据库专门用来存储、管理、查询和检索向量化的非结构化数据。

因此,对大模型应用开发者来说,向量数据库是非常重要的基础设施,在一定程度上影响着大模型的性能表现。

未来各家大模型优化到一定程度后,向量数据库的能力可能决定各家大模型的天花板。

此次零一万物笛卡尔向量数据库展示出优异表现,其背后又做了哪些方面的技术创新呢?

和传统检索方法类似,从本质上讲,RAG向量检索主要解决两大问题:

1. 通过建立某种索引结构,减少检索考察的候选集;

2. 降低单个向量计算的复杂度。

据介绍,针对第1个问题,零一万物团队有两大杀手锏:

• 全导航图技术。目前业内现状主要通过哈希、KD-Tree、VP-Tree等方式,导航效果不够精确,裁剪力度不够,零一万物研发的全局多层缩略图导航技术,图上坐标系导航,既能保证精度,又能裁剪大量无关向量。

华为mate 50 pro 最新消息

• 首创自适应邻居选择策略,填补业界空白。零一万物自研的自适应邻居选择策略,突破了以往仅依赖真实topk或固定边选择策略的局限,新策略使每个节点可以根据自身及邻居的分布特征动态地选取最佳邻居边,更快收敛接近目标向量,从而让RAG向量检索性能提高15%-30%。

针对第2个问题,零一万物采用了两级量化方案增强RAG。

零一万物用两级量化降低计算复杂度,同时列式存储充分利用SIMD的并发能力,进一步发挥硬件能力,相比传统PQ查表,性能得到大幅提升到2-3倍。除此之外,零一万物还有索引结构优化、连通性保障等全栈向量技术方案提高笛卡尔向量数据库的性能。

作为高性能向量数据库,笛卡尔向量数据库可以轻松应对百分之八九十的日常场景,比如帮助企业客户构建私域知识库、智能客服系统;在自动驾驶领域,使用高性能向量数据库可来加速自动驾驶模型训练等。

零一万物表示,笛卡尔向量数据库是团队基于RAG的初步尝试,将在近期发布的AI生产力产品中得到有效应用。零一万物后续会持续专注研发和分享,为用户带来更好的技术和体验。

 


返回网站首页

本文评论
腾讯音乐股票行情跌的原因_中概股周一收盘涨跌互现 腾讯音乐涨近6% 趣活跌超11%
iphone13会升级快充吗微软游戏模式手机评测安兔兔现金贷风控   北京时间16日凌晨,美股周一小幅收高,主要股指延续上周涨势。市场继续关注全球经济衰退风险,并等待美国零售巨...
日期:08-16
这“只”有火眼金睛的AI“小猴子”,华科大团队研发!_小猴子g5
湖北日报讯(通讯员汪伟颋、高翔)近日,华中科技大学软件学院白翔教授领衔的VLRLab团队发布了多模态大模型——“Monkey”。该模型能够实现对世界的“观察”,对图片进行深入的问答...
日期:12-13
百度联盟携手去哪儿网打击机票诈骗和山寨现象
  机票诈骗和山寨现象,一直是中文在线旅行网站面临的困扰之一。去哪儿网副总裁戴政表示,消费者通过搜索引擎进入山寨的去哪儿网的网站进行机票预定,结果预付了费用,钱款遭遇...
日期:07-28
惠普第三季推Hurricane平板电脑 基于WebOS
  据国外媒体报道,惠普公司内部人士透露,惠普正在开发一款基于WebOS的平板电脑,最早将于今年第三季度上市。   这款平板电脑的开发代号为“Hurricane”,基于惠普刚刚收购的...
日期:07-29
visaio「Visa启动1亿美元AI创投计划,致力推动生成式AI创新」
文章概要:1. Visa公司推出1亿美元生成式AI创投计划,支持新兴公司发展生成式AI技术,改变未来商务和支付系统。2. 该计划由Visa Ventures监管,重点投资于生成式AI技术领域的初创...
日期:10-08
三星One UI 6测试版曝光 或在下周发布_三星one ui 2.5新功能
7月12日 消息:根据最新报道,三星的One UI6测试版预计将在本月第三周首次亮相,这意味着首个测试版更新可能会在下周发布。其中,首个测试机型将是三星Galaxy S23系列。雷军说手机...
日期:07-12
抖音电商宣布新增《抖音电商“0元入驻”试运营规范》「抖音商品0元起是包邮的么」
2月14日 消息:抖音电商发布意见征集通知称,为了保护消费者权益,规范商家经营行为,现修订《抖音电商“0元入驻”试运营规范》 ,意见征集期内(2023年02月13日—2023年02月20日。苹...
日期:02-15
罗永浩都说好的顺造吸尘器 618促销正式启动(顺造吸尘器z1)
  打扫卫生,是家庭生活的日常。女人搞卫生时心思细腻,甚至达到“强迫症”的程度,房间的边边角角都不能残留任何垃圾杂物;男人搞卫生相对比较“粗线条”,有时只求速度却忽...
日期:07-14
套娃式电视会员引热议!平台开始反薅用户羊毛
近日套娃式电视会员引热议,有网民发视频吐槽智能电视视频App收费高,通过电视机下载的视频App看电视剧、电影、动画,居然要分别收费。视频发出后,收到了很多网友的点赞和留言。所...
日期:01-16
天玑9200 加持!曝vivo X90S下月发布_vivo天玑900新机曝光
近日,联发科发布的天玑9200 旗舰处理器在安卓平台上表现出色,以安兔兔跑分排名第一的成绩拿下了最强性能的称号。有消息称,vivo X90S机型将搭载该芯片,并计划于6月份发布。据了...
日期:05-23
性能最强荣耀手机!荣耀90 GT发布:2599元起_荣耀九百度百科
快科技12月21日消息,荣耀90 GT正式发布。售价方面,12GB 256GB售价2699元,16GB 256GB售价2899元,16GB 512GB售价3199元,24GB 1TB售价3699元。该机定位是高性能,是迄今为止性能最强...
日期:12-21
支付宝公益平台:已联合2000多家公益机构服务1.1亿捐赠人「支付宝公益捐赠可靠吗」
5月17日 消息:5月15-16日,支付宝公益2023年生态伙伴大会杭州召开,来自中国社会科学院、上海交通大学等高校专家学者,公益组织负责人等200余位代表现场参会,围绕近年公益行业趋势...
日期:05-17
社科院发2022网文报告:市场规模增长8.8% 00后成网文作家新增主力「2021网文发展」
4月11日消息,日前中国社会科学院文学研究所发布《2022中国网络文学发展研究报告》(以下简称“报告”),报告所引数据显示,2022年网络文学市场规模389.3亿元,同比实现了8.8%的增长;20...
日期:04-11
裁员、翻车、搞电商:B站直播往何处去「b站直播卖货吗」
声明:本文来自于微信公众号卡思数据(ID:caasdata6),作者:林午,授权转载发布。2022年,B站直播部门陷在“裁员”风波里。4月,有消息称B站直播业务部门计划裁员,原因可能为入驻公会与...
日期:02-09
SoraFlows官网体验入口 sora生成的视频免费下载地址_sora life
SoraFlows是一个开源的WebUi视频生成平台。用户只需要输入文本描述,就可以通过Sora模型生成高质量的视频。该平台提供强大的定制化功能,支持多种画面和视角的组合,可用于营销、...
日期:02-26
马斯克被爆当场解雇推特工程师 原因竟是人气下降「马斯克推特有多少粉丝」
凤凰网科技讯 北京时间2月10日消息,知情人士称,推特老板埃隆马斯克(Elon Musk)近日当场解雇了一名推特高级工程师,原因是这名工程师告诉他,他在推特上的人气正在下降。马斯克周...
日期:02-13
神舟十五三名航天员正式进驻空间站 六人合影谈笑风生_神舟十二号航天员进驻空间站
神舟十五号载人飞船入轨后,于北京时间2022年11月30日5时42分,成功对接于空间站天和核心舱前向端口,整个对接过程历时约6.5小时。根据现场直播,截至发稿,费俊龙、邓清明、张陆3名...
日期:12-02
网络黑产猖獗,蚁盾让春节出行洒满“阳光”
  2019年春运已拉开帷幕,预计全国旅客发送量将达到29.9亿人次。中国人一年一度的迁徙盛景,随着传统春节的来临拉开大幕。火车站、汽车站、飞机场……川流不息的人群间,攒动...
日期:09-20
中国知网控股人_首次披露!知网发言人:100%国有控股,2021年已支付版权费1.56亿
来源:光明日报   8月11日上午,在北京海淀知网总部,知网副总经理兼新闻发言人肖宏就网友关心问题,接受光明日报记者采访,首次披露多方面信息。 方太净水器介绍6.1英寸和7.9英寸...
日期:08-12
人工智能打造“功夫熊猫”是深兰科技公交智能转型之路之一
  深兰科技自2017年开始尝试整车设计,一路至今,推出多项应用成果,同时取得多个城市的自动驾驶牌测试照。经过三年中无数次的钻研和打磨,最终形成的熊猫智能公交整合自动驾驶...
日期:07-16