您的位置:首页 > 互联网

贾扬清几几年「贾扬清的500行代码,掀翻了Perplexity5.2亿的桌子?」

发布时间:2024-02-01 15:34:33  来源:互联网     背景:


500行代码VS估值5亿

1月25日,自从宣布创业后就备受社区瞩目的贾扬清,在推特上展示了一个对话式搜索引擎的demo。

这个demo基于他创办的LeptonAI提供的框架,“只用500行python 代码”就开发完成。在邀请大家体验同时,贾扬清也表示后续计划把代码开源。在介绍Lepton Search的一系列推特里,他还艾特了Perplexity——估值已经达到5.2亿的当红对话式搜索公司,并表示受到他们优秀产品的启发。

而这也很快吸引来Perplexiyt的注意,但引来的并不是什么好话。


其创始人Aravind Srinivas在推特上很快转发贾扬清的推特并表示:“太棒了,看到 Perplexity 成为一些融资动作的参照物,包括前 Meta 和阿里巴巴高管都这样做。这说明 Perplexity 的影响力不局限于产品本身,而是辐射到了整个科技生态和行业发展,令人振奋!”

翻译过来就一句话:Lepton为了融资而抄了我Perplexity尊贵的前端代码。

而这条推特下面不乏煽风点火的评论,有人说Aravind你说的真委婉,这不就是抄袭了。但也有人指出,Aravind是反应过度,Lepton根本不是个做搜索的公司,人干嘛要盯着你借鉴。

贾扬清也迅速回应,感谢了对方“友好的评论”,然后立刻表示咱们开源见。

之后加速写代码,居然一个周末不到真就把代码开源了。

然后这500行代码在周日上线Github,一天后拿到Githhub热榜第一,第二天继续热榜。星星数不断增长,目前三天已经有了4500颗星星。


而从人们的讨论看,有人已经基于它拿到了一些黑客松冠军,它还被一款聚焦开发者版的Perplexity产品集成,其CEO夸赞这给自己带来速度大幅提升。许多体验和对比了Lepton和Perplexity的用户也夸赞了Lepton的体验。而且它还在不停迭代功能,两天不到,贾扬清和团队成员就给它增加了包括中文在内的多语言支持,把对话结果分享到推特和Facebook的功能,以及更多的API合作。

简单体验它后,我发现它确实用户界面更加简洁,速度也快很多。当然,它的功能整体也更简单,比如在每一次回答后,它就结束,再次输入开启的是新一轮回答,而非持续的对话。包括提问的长度识别,中文的识别等一些小bug也依然存在。

但他显然打破了我对Perplexity的一部分滤镜。

Perplexity的护城河被捅破了?

在开源代码后,贾扬清不忘再次艾特Aravind,表示期待合作,可以让对方体验一下真正“快速,云原生和用户体验友好的平台”。但这一次Aravind没再说什么奇怪的话。

谷歌pixel 3和pixel3xl

事实上这500行代码以一种最粗暴的方式把所谓十几年来第一次能挑战谷歌的创新——对话式搜索的真实技术含量展示了出来。

从代码入手看一看,它一共就是几个步骤:1.获取查询,说白了就是得到用户输入的文字、2.抓取用户输入关键字相关的搜索页面、3.解析网页文本、4.基于文本构建提示词、5.把提示词递交给大语言模型、6.把大语言模型生成的结果返回给用户。

当然它还有些具体区别,比如搜索的来源——是使用Bing或Google的API,还是使用一个自己的数据库;背后大模型上的选择,是Mistral 还是Llama这些开源的,还是直接使用OpenAI的API,或像Perplexity还有自己的几款模型供选择;以及大模型在其中起作用的方式,是直接让它根据需求生成回答,还是经过一定的Prompt优化。

不过这样看起来你很快会明白,它本质上是关于更好使用别人API的技术。

也就是说,这一切还是建立在传统搜索引擎提供的检索能力之上——想要替代Google的Perplexity是建立在Google的API之上的。它们本质上属于RAG技术的应用,只不过,R更多来自对其他人API的系统性掌握,而G似乎可以更多归功于自己的能力。贾扬清则表示,他在开发过程里发现在RAG里,R(检索)比G(生成)的重要性更大。这样看来,目前Lepton Search的demo之所以一开始没有做多轮对话的能力,也似乎因为这个思路。展示R的能力更加重要。

Perplexity同样沿着相似的技术思路,而在一些技术人士看来,他们的根源可能来自一篇Google和OpenAI合作的论文——是的,今天看起来可能不再可能一起写论文的两家公司,最后一次合作是对话式搜索的技术原理。

在这篇《FreshLLMs: Refreshing Large Language Models with Search Engine Augmentation》的论文里,他们提出了一种FreshPrompt的技术思路,也就是为了解决预训练模型对正在发生的事情的无知,要把它与实时搜索能力结合,而结合的方法是通过提供一种Prompt,这种Prompt本身是在按照发布日期,关键信源等各种要素来为大模型提供上下文信息,并通过一组优化的Prompt来引导和改善大模型生成更实时更好的回答。

这种技术思路其实也在指向R的重要性可能大过G。

Perplexity的网页版事实上诞生于这个论文之前,但据一些研究它产品逻辑的人表示,这个论文提出的方法也被用到后来Perplexity迭代后的产品中。

而只要看看这张论文里给出的prompt示意图,这种技术方案之下,前端长成什么样最终似乎就是一个大概率的雷同。

贾扬清出生年月

贾扬清年薪是多少


说了这么多,其实你会发现,如果换成一个其他的基于“别人”的API和大模型能力,以及公开的论文给出的技术路线而开发的应用,可能这“抄袭”的指责只会让人一笑而过。Perplexity的指责似乎也是一样的事情,贾扬清的500行代码成了破解独角兽身份带来的技术幻觉最好的解药。

醉翁之意

但没人否认的是,Perplexity依然是一款好产品。

然而一款充满新设计的产品的好,在于功能体验的量级上的领先,它来自对一整个系统的好品味与一个个细节积攒起来的优化。对Perplexity来说,对大模型和召回技术的理解,以及它们与应用的结合才是它快速成功的关键。而不在于一个单点的而且事实上也并不新鲜的概念。

在把理念通过简洁的前端实现后,perplexity真正抓住用户的是对产品的打磨进而将对话能力与强大搜索引擎的准确性相结合。这背后是各种细节,品味,经验积累的最终结果。因此,它的护城河必然和时间成正比,从今天人们对它的好评也能看出——速度快,体验丝滑,都是最朴素的感知,也是最容易替代的感知,因此在面对一个速度甚至更快的Lepton开源产品demo时,弦自然绷紧了。

而这也带来整件事里真正有意思的地方:Perplexity暗示Lepton是抄袭其实在揣着明白装糊涂。这种做法的一个表面上的作用,自然是“掩盖”上面讲的技术门槛并不高这件事。而除此之外,装糊涂其实还有更重要的理由。

iphone12销量惨淡

贾扬清在去年离开阿里后,创业初期其实十分低调。但这名开发了Caffe,核心参与了Tensorflow和Pytorch的框架大神,身经百战的原阿里副总裁,显然对自己和团队的技术能力并不低调。在9月时我在硅谷听他创业后的第一次公开分享,他已经在展示自己的Lepton服务是大模型基础框架服务里速度第一的存在。只不过,现在看起来当时Lepton仍处早期,对更多模型的适配,对算力的建设等都在解决当中。


而进入2024年,贾扬清和Lepton开始逐渐高调。这一次Lepton Search的发布像是一个转折点。这家创业公司正式开始进入战场。

在这条Lepton Search的发布推特引发讨论的同一天,AI创业公司Martian的一份开源大模型API推理榜单发布,对多款推理产品在主要的开源模型上的推理成本、速率和吞吐量等指标做了测试,而Lepton拿下多项关键指标第一。在另一个由ArtificialAnalysis.ai发布的API推理榜单中,Lepton也拿下了Mixtral 8x7B这个模型的每秒处理Token数的第一,并且是唯一一个支持Mixtral 32k上下文窗口的服务。“它的价格也极具竞争力”,这个榜单这样说。

而在贾扬清转发的榜单图中,Lepton高高的圆圈旁边,被它超过的一个小圆圈正是Perplexity。


是的,Perplexity才不只是一个应用公司。

在Perplexity的对话搜索产品之外,Perplexity Lab其实和Lepton一样,也是一个API推理服务商,比如最近刚发布的CodeLlama-70B-Instruct,就可以购买Perplexity Lab的API来直接使用,这也是最近Perplexity真正在发力的重点,它的社交媒体等账号在大力推广的是这个服务。

相比Perplexity这个搜索应用,Lepton无疑直接冲击的是后面这部分的付费用户。

这对Perplexity有多重要呢?

事实上今天的Perplexity有点挂羊头卖狗肉的意味:

用一个极具话题度(VC可以参与共谋)的toC产品吸引融资弹药,然后补贴到API 烧钱竞赛中去。因为前者面对的是今天商业世界里最成熟的全家桶+广告的搜索商业模式,而后者则是在新周期里重演一遍被验证多次的规模效益的机会——先烧钱拿到市场份额,再提高收费。

也就是说都是关乎API,一个是成本,一个是收益。一个是被数据方控制生死的应用,一个是掘金潮里卖铲子的生意。你说拿个真正更重要呢?

星链马斯克和特斯拉马斯克

而且,如果去看一看Perplexity创业初期的故事,它最早做了一款口碑不错的推特内容的搜索,后来正因为马斯克收购推特后大幅提高API价格而被迫放弃。这些经验Perplexity显然是吸取了,不想再犯一次。

所以装糊涂的第二层目的就是借着先占据的领先和C端产品的存在感发起一下进攻,骚扰一下在基础设施端未来肉眼可见必有一战的强敌。

看来所有人都意识到,在AI基础设施层面,在所谓的API框架层面,一场更持久的战争要来了。


欢迎加入这个星球,见证硅基时代发展↓


返回网站首页

本文评论
Canalys预测:2024年全球个人电脑市场将增长8%_2021电脑市场份额
12月5日,Canalys发布的最新报告显示,全球个人电脑出货量在连续七个季度下跌后有望迎来复苏,在节日旺季和宏观经济改善的推动下,预计2023年第四季度市场将增长5%。展望未来,2024年...
日期:12-05
奇瑞高端suv星途「17万元起真香!奇瑞最高颜值SUV星途瑶光盲订量已达6012台」
1月4日消息,据奇瑞星途光官方,旗下全新SUV车型瑶光自开启盲订以来,仅一周内订单量已达6012台。mate50pro5g详细参数配置盲订开启后的第一秒,便有12位用户同时下订,前60秒内更是产...
日期:01-04
芯片销量大幅下滑:周一台积电股价跌超7% 三星电子跌去3.9%「台积电第三季度财报」
本周一,大型半导体代工企业的股价遭受了重创。其中台积电(TSMC)应声下跌 7.1%,落到了 2021 年 1 季度以来的最低水平。与此同时,三星电子跌去了 3.9%、SK 海力士也下滑了 3.5% 。...
日期:10-26
微软自研arm「科技巨头微软重磅官宣:推出AI自研芯片!」
每经编辑:杜宇据微软官网,在当地时间周三(11月15日)举行的Microsoft Ignite全球技术大会上,微软发布自研人工智能Microsoft Azure Maia ,以及英特尔CPU的竞品:基于Arm架构的云原生...
日期:11-16
位列第一!曙光存储再定义“先进存力”_网易科技_曙光存储配置手册
(原标题:位列第一!曙光存储再定义“先进存力”) 在“东数西算”战略要求,和AI产业应用需求驱动下,先进存力已成为数字经济高质...
日期:12-22
多家医院优化流程减少候诊时间_多家医院优化流程减少候诊时间的原因
  中西医“一站式”诊疗,省去楼上楼下跑;线上医保结算,缴费不需排队;医院联动社区,提供“一站式”服务……正值呼吸道传染病高发期,记者探访发现,多家医疗机构优化了就诊流程,让患...
日期:12-08
谷歌称搜索进入对话式人工智能功能新纪元_谷歌的人工智能
5月11日消息,谷歌于美国当地时间周三推出了其搜索引擎的对话功能,并让讲英语的聊天机器人Bard被广泛使用,这是谷歌与微软以及越来越多的初创公司进行竞争,以人工智能产品赢得消...
日期:05-11
守护绿色家园 三星BESPOKE缤色铂格系列产品让环保成为日常_三星伯爵系列
人类赖以生存的地球只有一个,越来越多人逐渐建立起环保意识,通过绿色低碳的生活和行为方式改善地球的整体环境。做为低碳节能的领航者,三星BESPOKE缤色铂格系列产品一直秉持可...
日期:04-21
封杀自研CPU、GPU 高通指控ARM赶尽杀绝:回应来了_GPU高通
ARM是全球移动芯片无冕之王,手机、平板的CPU几乎离不开ARM CPU,而高通则是ARM的大客户之一,然而双方最近翻脸,ARM上个月起诉高通,高通日前反诉ARM,并且曝光了一个惊天猛料。新手如...
日期:10-30
马斯克扎克伯格“约架”笼斗:首选地点拉斯维加斯_对于马斯克和扎克伯格的论战,你更支持谁的观点?
7月4日消息,最近特斯拉CEO马斯克表示,他准备与Meta CEO扎克伯格进行一场笼斗”,首选地点为拉斯维加斯终极格斗冠军赛赛场。这两人在网络上互不相让,表面看来娱乐性十足,但实际上...
日期:07-05
5g不如wifi_WiFi会输给5G网络吗?腾讯WiFi管家助力连接优质WiFi
  5G网络越来越热,不仅实力强劲的企业抢先入局,也成为普通用户茶前饭后的谈资。近日,上海虹桥火车站启动5G网络建设,是全球首个5G室内数字系统建设的火车站。目前,用户在虹桥...
日期:07-28
阿里放手,蚂蚁渐行渐远
文/一橙今日早间,蚂蚁集团发布公告,称为了进一步适应现代公司治理体系的要求,推动股东投票权与其经济利益相匹配,蚂蚁集团主要股东及相关受益人拟对蚂蚁集团股东上层结构进行调...
日期:01-07
优版权国际站正式上线,用数字藏品助力文化出海「优版权怎么玩」
随着数字经济的快速发展,区块链技术和Web3. 0 已成为未来数字经济的重要驱动力。作为国内较早入局Web3. 0 赛道的平台之一,优版权近期正式上线国际站(ubanquan.hk), 计划以香港为...
日期:07-15
苹果因不送iPhone充电器被巴西罚款1.4亿 苹果表示不服「苹果不赠充电器被罚200万美元」
凤凰网科技讯 北京时间10月14日消息,巴西一家法院周四对苹果公司处以1亿雷亚尔(约合1.36亿元人民币)的罚款,并裁定苹果在巴西销售的新iPhone手机必须配备电池充电器。苹果十月...
日期:10-21
微软画图应用更新,进一步升级 Win11 风格 WinUI 元素
  去年 12 月,微软测试了新的画图应用程序。新版应用在“编辑颜色”和“调整大小和倾斜”对话框中获得了 Windows 11 风格的设计主题。   现在在最新的预览版 Windows 1...
日期:07-18
38岁记者辞职靠养花月入10万,抖音电商“富知计划”助力知识创作者变现
  “说到养花,很多人联想到的是美女,但你可能想不到的是,在鲜花的背后,也可以是像我这样一个男人,我叫周昆,一个靠‘沾花惹草’养家糊口的男人。”   他的名字叫周昆,...
日期:05-04
加速拥抱AI,也许并非唯一解「加速拥抱ai,也许并非唯一解放」
声明:本文来自于微信公众号 黄有璨(ID:owen_hyc),作者:黄有璨,授权转载发布。(1)近来的AI2.0和生成式AI有多火?一周以前,我有天从一个朋友的公司到机场,几个不同环境,看到几波背景完全不...
日期:04-10
套现约466亿元!为收购推特,大笔减持特斯拉,马斯克最新回应:可能会买回来!
编辑/郑雨航   据马斯克美东时间周二提交给美国证券交易委员会(SEC)的监管文件,马斯克于8月5日~8月9日减持了约792.4万股特斯拉股票,减持价格区间为838.571美元~911.752美元/...
日期:08-11
中国电动车企涌向香港,想借金融体系扩张全球业务_香港电动单车
12月29日消息,不少涉足电动车行业的中国企业都开始在香港设立办事处,想要利用香港的金融体系来扩大全球业务。到目前为止,这些公司在香港的总投资已经超过10亿美元,同时也为当地...
日期:12-29
长安深蓝SL03行驶中自燃 车尾冒出明火和浓烟_长安汽车蓝色
据 汽车通病曝光台 报道,3月14日晚,有网友在社交平台上传了一则视频,视频中一辆行驶中的长安深蓝SL03在山东某公路上自燃。华米amazfit智能手表gtr2根据视频来看,车尾的左侧面冒...
日期:03-16