您的位置:首页 > 互联网

谷歌编程比赛「2024年AI编程有多强?谷歌工程主管揭秘残酷真相」

发布时间:2024-12-31 19:56:33  来源:互联网     背景:

声明:本文来自于微信公众号新智元,授权转载发布。

2024年的AI编程到底什么实力?近日,谷歌的工程主管Addy Osmani,为我们揭示了AI辅助编码在一线开发中的真实情况。

2024年,AI编程已然渗透了各行各业,影响着软件的整个生命周期。

谷歌编程比赛

那么问题来了,AI coding用过都说好,但我们平时用的软件咋感觉没啥进步呢?

近日,Addy Osmani,谷歌的工程主管,同时也是一位亚马逊畅销书作家,为我们揭示了AI辅助编码在一线开发中的真实情况。

科学家用蟹壳制成可生物降解电池材料

码农怎么用AI?

一般来说,团队利用AI进行开发有两种不同的模式:引导程序(bootstrappers) 和 迭代器(iterators)。两者都在帮助工程师(甚至是非技术用户)缩小从想法到执行的差距。

Bootstrappers

这一类包括Bolt, v0, 和screenshot-to-code等AI工具,其特点为:

从设计或粗略概念开始;

使用AI生成完整的初始代码库;

能够在几小时或几天内获得工作原型;

专注于快速验证和迭代

这样的工作流令人印象深刻。比如一位独立开发人员可以使用Bolt,在短时间内将Figma设计转变为有效的Web应用程序。尽管达不到生产级别的要求,但用来获得初步的用户反馈绰绰有余。

Iterators

这一类主要负责日常开发工作流程,包括Cursor、Cline、C o pilot和WindSurf等工具,效果没有上面那么浮夸,但更加实在,比如:

完成代码、提供建议;

执行复杂的重构任务;

生成测试和文档;

作为解决问题的结对程序员

虽然这两种方法都可以大大加快开发速度,但天下没有免费的午餐。

AI速度的隐性成本

高级工程师使用Cursor或C opilot等AI工具,可以在几分钟内搭建整个功能的基架,并完成测试和文档,就像变魔术一样。

但仔细观察就会发现,在参考AI建议的同时,资深工程师们还会:

将生成的代码重构为更小的模块;

添加边缘情况处理;

优化类型定义和接口;

添加全面的错误处理;

甚至是质疑AI给出的架构

换句话说,他们正在用多年积累的工程智慧,塑造和限制AI的输出。AI负责加速代码实现,但人类的专业知识确保代码的可维护性。

而初级工程师就经常错过这些关键步骤。他们更容易接受AI的输出,从而导致所谓的纸牌屋代码(house of cards code)——看起来很完整,但在现实世界的压力下会崩溃。

知识悖论

所以实际上,相比于初学者,AI反而更能帮助有经验的开发人员,——这多少有点反直觉。

高级工程师利用AI快速构建想法的原型(理解)、生成基本实现(可改进)、探索已知问题的替代方法等等;

而初学者却经常接受不正确或过时的解决方案、忽略关键的安全性和性能问题、不知道如何调试AI生成的代码,最终构建了一个自己不完全理解的脆弱系统。

70% problem

使用AI进行编码的非工程师,经常遇到一个窘境:他们可以出人意料地迅速完成70%的工作,但最后的30%就相当痛苦了。

70% problem揭示了AI辅助开发的现状,刚开始如有神助,后来被现实按在地上摩擦。

实际情况通常是:

尝试修复一个小错误——>

用手机创作音乐

AI提出了一个似乎合理的更改——>

这个更改破坏了其他一些东西——>

要求AI修复新问题——>

又产生了两个新bug——>

无限循环

这个循环对于非工程师来说尤其痛苦,因为他们缺乏专业知识来理解真正出了什么问题。

有经验的开发人员遇到bug时,可以根据多年的模式识别来推理潜在原因和解决方案。如果没有这个背景,那基本上就是在用自己不完全理解的代码打地鼠。

学习悖论

还有一个更深层次的问题:让非工程师使用AI编码工具,实际上可能会阻碍学习。

代码生成了、运行了,但开发者不了解基本原理,此时,他错过了学习基本模式、没有培养调试技能、无法对架构决策进行推理,而这份代码又需要维护和扩展。

于是,开发者不断返回AI来解决问题,而没有培养自己处理问题的专业能力。

非工程师使用AI编码工具的最好方式可能是混合模式:

1. 使用AI进行快速原型设计

2. 花点时间了解生成的代码是如何工作的

3. 学习基本的编程概念以及AI使用

4. 逐步建立知识基础

5. 将AI用作学习工具,而不仅仅是代码生成器

但这需要耐心和奉献精神,与许多人使用AI工具的目标恰恰相反。

70% problem表明,当前的AI还不是许多人希望的那个AI。最后30%的工作(使软件可用于生产、可维护等),仍然需要真正的工程知识。

最佳实践

Addy Osmani观察了几十个团队,总结了一些最佳实践方式:

AI初稿模式

让 AI 生成基本实现;手动审查和模块化重构;添加全面的错误处理;编写全面的测试;记录关键决策。

持续对话模式

为每个不同的任务开始新的AI聊天;保持上下文集中和最小;经常查看和提交更改;保持紧密的反馈循环。

信任但验证模式

使用AI生成初始代码;手动审查所有关键路径;边缘案例的自动测试;定期安全审计。

AI的真正前景?

尽管存在这些挑战,但作者对AI在软件开发中的作用持乐观态度。关键是要充分利用AI的真正优势:

加速已知AI擅长帮助实现我们已经了解的模式,就像有一个无限耐心的结对程序员,他可以非常快速地打字。

探索可能性AI非常适合快速构建想法原型和探索不同的方法,就像一个沙箱,我们可以在其中快速测试概念。

自动化例程AI大大减少了花在样板和日常编码任务上的时间,让我们可以专注于有趣的问题。

如果您刚刚开始AI辅助开发,作者的建议是,先从小处着手。

将AI用于非耦合的、定义明确的任务,查看生成的每一行代码,逐渐构建更大的功能。

过程中保持模块化:将所有内容分解为小的重点文件,在组件之间保持清晰的接口,记录模块的边界。

腾讯大制作电视剧

重要的一点是,相信自己的经验:AI用来加速而不能取代你的判断、感觉不对劲时要质疑、时刻维护自己的工程标准。

Agent兴起

随着我们进入2025年,AI辅助开发的格局正在发生巨大变化。虽然当前的工具已经改变了原型设计和迭代方式,但我们正处于更重要转型的风口浪尖:智能体(Agent)软件工程的兴起。

智能体系统不仅可以响应提示,还将以越来越高的自主性规划、执行和迭代解决方案。

比如Anthropic的Claude能够使用计算机,或者Cline自动启动浏览器和运行测试的能力。

在调试过程中,智能体系统不仅给出修复bug的建议,还可以:

主动识别潜在问题、启动和运行测试套件、检查UI元素并捕获屏幕截图、提出并实施修复、验证解决方案是否有效。

下一代工具将可以无缝集成视觉理解(UI 屏幕截图、模型、图表)、口头语言对话和环境交互(浏览器、终端、API)。

未来的AI不是取代开发人员,而是成为一个越来越有能力的协作者,既可以采取主动,又能尊重人类的指导和专业知识。

参考资料:

https://addyo.substack.com/p/the-70-problem-hard-truths-about


返回网站首页

本文评论
国家算力网络体系「信通院联合多国机构立项算力互联网ITU国际标准」
国际电信联盟第十三研究组(简称ITU-T SG13)于2024年7月15日-26日在瑞士日内瓦召开全体会议,来自世界各国的百余名代表参加会议。会上,由中国信息通信研究院(简称“中国信通院”)和...
日期:07-31
2024全球手机单品销量Top10:苹果三星占据半壁江山_21年手机全球销量排行
2024年第二季度,全球手机单品销量占比数据揭晓。根据市场调查机构Counterpoint Research的报告显示,苹果和三星成为了这个季度全球手机销量排行榜前十名中的主力军。令人欣喜...
日期:08-02
Facebook将向美国20万家小企业提供免费广告券_Facebook广告收益
  9月19日消息,据国外媒体报道,Facebook首席运营官Sheryl Sandberg上周五在接受采访时称,公司下周将启动一个免费广告项目向20万家美国小企业提供50美元的免费广告券。   ...
日期:07-23
一加Ace Pro原神限定版真机公布 含定制礼盒_一加原神联动礼盒
一加Ace Pro原神限定版真机公布没新机将今晚正式发布,一加Ace Pro限定机在设计上融入了大量胡桃的主题元素。在手机后壳的下方,可以看到胡桃头像的蚀刻图案,清晰明了的展现了此...
日期:10-27
汽油车与新能源汽车发展「汽车全面电动化 我国汽油消费已经到顶:未来只能加大出口」
最近十多年来,以电动车为代表的新能源汽车在国内爆发式增长,燃油车在下降,这也导致国内的汽油消费已经到顶了,未来只能加大出口。懒财网公告据乘联会秘书长崔东树发布的信息,我国...
日期:10-30
小米Civi 4手机入网:支持卫星通信 预计5月发布_小米civi是4g吗
2月18日 消息:近日,小米Civi4 手机成功获得了工信部电信设备进网许可,设备名称显示为“卫星移动终端”,支持天通卫星通信制式。这一消息表明,小米Civi4 将成为继小米14 Ultra之...
日期:02-18
爱奇艺出品谍战生活剧《孤舟》8月6日播出,曾舜晞张颂文上演智勇对决
  《唐朝诡事录之西行》高热收官之后,备受观众期待的谍战生活剧《孤舟》精彩来袭!8月6日,由爱奇艺出品,幸福蓝海联合出品,爱奇艺众拾工作室打造的《孤舟》在爱奇艺首播。该剧...
日期:08-07
华为海思再次给出惊喜,显示芯片V811曝光,性能已达行业顶级水平
华为海思再次给出惊喜,不服真的不行!近日,一款名为V811的海思芯片曝光,它是一个颗电视芯片。4000系列锐龙APUV811采用A73+A53双架构4核CPU和4核G51 GPU,支持多种格式,包括AVS2、MP...
日期:06-02
互联网分级制度_分类分级是推动平台互联互通的关键一步
作者:陈兵;;责编:任绍敏   分类分级规范体系与新《反垄断法》结合,能提升平台经济反垄断监管效能。   8月1日起,新《反垄断法》正式施行,其在总则部分增加第9条规定“经营者...
日期:08-21
ai模型市场「AI大模型真的引领了国内的“资本盛宴”吗?是,也不是」
声明:本文来自于微信公众号互联网怪盗团(ID:TMTphantom),授权转载发布。AI大模型是2023年迄今资本市场最热门的名词,在美国如此,在中国也是如此。在各种社交媒体平台,每天都可以看到...
日期:07-25
香港恒生指数收涨0.03% 理想汽车收涨超4%_香港恒生指数收市 行情
  讯 9月27日上午消息,香港恒生指数收涨0.03%,结束日线四连跌;恒生科技指数涨0.55%。理想汽车收涨超4%,美团收涨4%。骁龙8cx Gen2爱奇艺电视果5S华为harmonyos2.0适用机型开发...
日期:10-03
小米13外观曝光!陶瓷机身酷似MIX_小米手机陶瓷机身
中关村在线消息:近日,小米官方频频预热小米13系列,但是背部的外观一直没有公布。不过网上曝光了不少,我为大家挑选了一些比较真实的信息。微软迷你冰箱华为mate50升级新鸿蒙可...
日期:12-02
7月13日发布京东大模型-京东官宣_京东汽车模型
【】6月21日消息,京东官方今日发布信息,“2023京东全球科技探索者大会暨京东云峰会”,将于7月13日在北京举办,届时将发布京东大模型。今年,4月8日,在人工智能大模型技术高峰论坛上...
日期:09-23
群发短信首次被诉非法经营 监管和定罪仍有难度
  群发广告短信让手机用户不堪其扰,却无计可施。近日,首次有人因群发短信而以涉嫌非法经营罪被起诉。   据《北京晚报》4日报道,4名男青年因未获许可经营短信群发业务,涉嫌...
日期:07-25
名创优品法国里昂首店开业 海外门店达2000家_名创优品 欧洲
10 月 8 日消息,近日,名创优品位于法国里昂大都会圣热尼拉瓦勒的门店开业,标志着名创优品累计在海外市场门店总数突破 2000 家。 2022 财年名创优品营收100. 86 亿元,同比增长11...
日期:10-09
践行科技向善,腾讯优图实验室发布两大AI+公益成果
  在2019全球数字生态大会AI分论坛上,腾讯优图实验室公布在公益领域的两大成果:跨年龄人脸识别技术打拐寻人、优图AI手语翻译机。看似与我们生活不相关的人工智能,在寻找走...
日期:07-10
荣耀X40 GT官宣 号称战神_荣耀x40怎么样
中关村在线消息:今日,荣耀官方放出了新机荣耀X40 GT的预热海报图,海报的标题是性能跃级标杆,号称战神登场。荣耀X40 GT可能是一台主打性价比的中端性能机,更多相关消息,还请等待后...
日期:10-09
S Plaid Track Pack刷新纽博格林赛道量产电动车最快圈速 使用圆形方向盘 特斯拉Model
 6 月 4 日消息,一辆装备了 Track Pack(赛道性能包)套件的特斯拉 Model S Plaid 在德国纽博格林赛道创造了量产电动车最快圈速的新纪录,比保时捷 Taycan Turbo S 之前的纪录快...
日期:09-25
《双城之战》第二季中文主题曲《这样很好(Isha's Song)》上线:陈奕迅演唱
快科技11月7日消息,《英雄联盟:双城之战》动画第二季中文主题曲,原声单曲《这样很好(Ishas Song)》今日正式上线,继续由陈奕迅演唱。纽曼手机指纹解锁目前,该主题曲已经上线QQ音...
日期:11-08