您的位置:首页 > 互联网

Design2Code:提供设计图,让多模态LLM自动生成前端代码_design implement

发布时间:2024-03-07 17:36:51  来源:互联网     背景:

划重点:

⭐️ 生成 AI 在近年来取得了快速进展,具有前所未有的多模态理解和代码生成能力。

⭐️ 研究对可视化设计转换为代码实现的任务进行了系统研究,提出了一套自动评估指标。

⭐️ GPT-4V 在任务中表现出色,生成的网页在视觉外观和内容方面有望取代原始参考网页。

3月7日 消息:近年来,生成 AI 在多模态理解和代码生成方面取得了显著进展,为前端开发带来了全新的范式。研究人员开展了对视觉设计转换为代码实现任务(称为 Design2Code)的系统研究。

design implement

Design2Code是一个微软的开源项目,目的是实现提供设计图,转换为前端代码,适用于前端开发者和设计师。

研究人员手动筛选了484个真实网页作为测试用例,并开发了一套自动评估指标,以评估当前多模态 LLMs 能够多大程度上生成直接渲染为给定参考网页的代码实现,以屏幕截图作为输入。

研究人员开发了一套多模态提示方法,并展示了它们在 GPT-4V 和 Gemini Vision Pro 上的有效性。他们还对开源的 Design2Code-18B 模型进行了微调,成功达到了 Gemini Pro Vision 的性能水平。

测试集示例

基准测试中的一些示例(用于评估目的;下面两行)与 Huggingface 创建的合成数据(用于训练目的;第一行)进行比较。基准测试包含具有不同复杂程度的各种现实世界网页。

三星折叠屏fold换屏幕多少钱

人类评估和自动指标显示,GPT-4V 在这一任务中表现出色,标注者认为 GPT-4V 生成的网页在视觉外观和内容方面有望在49% 的情况下取代原始参考网页。令人惊讶的是,在64% 的情况下,标注者认为 GPT-4V 生成的网页甚至比原始参考网页更好。

design generator

design implement

基准性能:自动指标

对于自动评估,考虑高级视觉相似性(CLIP)和低级元素匹配(块匹配、文本、位置、颜色)。

模型对比

一些案例研究示例来比较不同的提示方法和不同的模型。

r魂初号机卡西乌斯之枪

详细的细分指标表明,开源模型在从输入网页中召回视觉元素和生成正确布局设计方面大多落后,而在文本内容和着色方面则可以通过适当的微调得到显著改进。

项目入口:https://top.aibase.com/tool/design2code


返回网站首页

本文评论
蔚来发布第三季度财报:营收130亿元 四季度交付指引超4万辆_蔚来二季度财报发布时间
11月10日 消息:今日,蔚来发布2022年三季度财报。财报显示,蔚来第三季度营收130亿元,同比增32.6%;市场预期129.91亿元,上年同期98.05亿元。蔚来三季度经调整净亏为34.6亿元;预计...
日期:11-11
redrain黑客「威胁Reddit要公开80GB数据,黑客索要450万美元、回滚旧API」
 6 月 20 日消息,海外最大“贴吧”网站 Reddit 于今年 2 月遭到网络攻击,攻击者现在威胁 Reddit,如果不回滚到旧版 API,就公开窃取的 80GB 数据。勒索软件组织 BlackCat 于昨日...
日期:09-23
电池回收重大突破!瑞典科研团队提出新方案:可回收100%的铝和98%的锂
快科技10月22日消息,近日,瑞典查尔姆斯理工大学日前宣布:该校研究人员近期提出了一种新的、有效的方法来回收废旧电动汽车电池中的金属。这种方法可以回收电动汽车电池中100%的...
日期:10-22
小辣椒 手机_小辣椒手机是正品牌子吗?
小辣椒手机是中国国内品牌,一直以来都致力于为用户提供高性价比的智能手机产品。该品牌推出的手机具有较高的配置、较便宜的价格,因此深受消费者欢迎。下面将对小辣椒手机进行...
日期:05-30
豆瓣8.0分!电影《忠犬八公》票房破亿:冯小刚主演「忠犬八公电影上映时间」
4月5日消息,截至今日11时46分,电影《忠犬八公》票房突破1亿,截稿前,该片豆瓣评分8.0,1.9万豆瓣观众打分,其中5星好评为30.5%,4星占44.5%。小米电视开不开机怎么回事儿生鲜电商新零...
日期:04-05
国产处理器变天!华为重磅决定:合并鲲鹏、飞腾两大处理器「华为鲲鹏处理器相当于英特尔」
快科技7月12日消息,当前,基于鲲鹏处理器、飞腾处理器的服务器和PC机已规模应用于政府、运营商、金融、电力等各大国计民生行业的核心业务场景,形成鲲鹏和PKS两大主流生态。佩奇...
日期:07-13
三星Galaxy S24 Ultra屏幕大改:弯曲度更小 接近平面
快科技10月4日消息,爆料人士Onleaks曝出了三星Galaxy S24 Ultra与前代机型的对比图,外观上最大的变化就是屏幕的弯曲度进一步缩窄,甚至接近平面。蔚来汽车临时停产5个从对比图...
日期:10-04
蔚来开启降价促销 降幅最高超10万 官方回应:没这么夸张「蔚来会降价吗?」
2月3日 消息:2日中午,有媒体报道指出,蔚来发起降价促销,2022款ES6和ES8最高可降价超过10万元,然而据易车报道,这个消息有夸大事实的嫌疑。报道指出,蔚来北京地区工作人员表示:“最...
日期:02-03
马斯克否认吸毒:定期接受药物抽检 未不合格_马斯克被感染
2024-01-09 02:42:35 作者:姚立伟 六个月宝宝的辅食一天吃几次iphone 15系列预计价格近日,著名科技企业家马斯克因涉嫌吸食毒品而引起广泛关注。对此,马斯克本人于7日发表声明...
日期:01-09
搜人功能正式上线 搜搜社区化战略再升级
社交关系火爆的互联网时代,搜索引擎如何帮助用户快速的找到那些志同道合的朋友,并与他们开展沟通和交流?近日,腾讯搜搜正式推出了“搜人”的社区搜索创新应用,为这一问题给出明...
日期:07-30
签约 | 金万维云联助力【中国化学工程第七建设有限公司】打造高速跨国访问
  中国化学工程第七建设有限公司(简称“七化建”),是国务院国有资产监督管理委员会管理的中国化学工程集团有限公司全资子公司,并于2009年随集团(股份)公司在上交所成功上...
日期:12-08
苹果15概念机「曝苹果 iPhone 15 系列 已备货 8900 万,立讯成第二大组装商」
据ctee 报道称,苹果已开始针对 iPhone 15 下达备货指令,7 月开始启动第一波备货潮,供应链已开始为零部件生产做准备。分析师预测,iPhone 15 整体性能提升,对消费者的吸引力将比 i...
日期:06-25
27 亿参数,微软发布 Phi-2 模型:某些性能指标优于 Llama-2-7B_微软hpc
IT之家 11 月 17 日消息,微软 Ignite 2023 大会已拉开帷幕,微软在本次活动中发布了旗下最小的语言模型 Phi-2,共有 27 亿参数,相比较此前版本有明显提升。IT之家注:微软于今年 6...
日期:11-17
雅虎和亚马逊适合 收购Hulu估值将超20亿美元(雅虎十亿美金投资阿里巴巴)
  北京时间6月24日消息,Hulu的潜在买家包括雅虎、亚马逊,估值可能为50倍市盈率(一段时间股票的价格和每股收益的比例),因为雅虎和亚马逊想拥有下一个Netflix。   Hulu的董事...
日期:07-30
利用RFID和NFC技术打造数字孪生,加速医疗业的数字化转型_rfid在医疗方面的应用
通信世界网消息(CWW)为了提高协作和流程的效率,实现实时信息的准确获取,增强决策能力,甚至改善患者治疗效果,医疗业不断加大数字孪生技术的占比,以收集、跟踪和分析有关医疗设备、...
日期:10-16
李楠成立怒喵科技,8月26日推出新品牌_怒喵科技创始人李楠
  (8月6日,北京)今日,李楠通过微博宣布,身份由「前魅族科技高级副总裁」更改为「 Angry Miao 怒喵科技创始人」,已获得美团龙珠资本数千万投资。未来将专注于做年轻人的品牌,...
日期:07-15
海外抖音tiktok带货「摸着抖音过河,TikTok搭商城、大搞货架电商」
声明:本文来自微信公众号“新播场”(ID:New_bc),作者:阿力古,授权转载发布。“有可能是抖音电商的成功经验,给了TikTok快速推进的信心”TikTok电商再一次跟上了抖音的步伐。2月20...
日期:03-01
联想控股 债券_联想集团发行总额12.5亿美元债券:用于实现净零排放愿景
7月28日,联想集团(HKSE:992)(ADR:LNVGY)宣布完成总额12.5亿美元双年期144A/S条例债券发行。其中,5.5年期6.25亿美元优先无担保票据和10年期6.25亿美元优先无担保绿色票据的票息率分...
日期:08-24
spacex成功发射火箭「SpaceX正在大肆招聘 准备把加州发射火箭的数量增加一倍」
SpaceX正计划大幅提高其从美国西海岸发射火箭的频率,这一信息来自于SpaceX的猎鹰9号运营经理为该公司在西海岸发射设施招募新员工的广告。SpaceX从三个地点发射任务,其中两个...
日期:09-27
私域 全域「公私域趋于融合的本质:服务在私域,成交在全域!」
声明:本文来自于微信公众号 见实(ID:jianshishijie),作者:陈姗,授权转载发布。过去,见实在和诸多品牌交流时,发现他们在私域的投入,主要集中在三个地方:一是和流量相关,愿意在公域投放...
日期:11-25