您的位置:首页 > 互联网

医疗评估是什么意思「Hugging Face 发布医疗任务评估基准Open Medical-LLM」

发布时间:2024-04-19 12:57:26  来源:互联网     背景:

划重点:

⭐️ Hugging Face 发布了一个新的医疗任务评估基准,旨在测试生成式人工智能模型在健康相关任务上的表现。

⭐️ Open Medical-LLM 基准由现有测试集拼接而成,涵盖多个医学领域,如解剖学、药理学、遗传学和临床实践。

⭐️ 一些医学专家对 Open Medical-LLM 提出了警告,强调实际临床实践与医学问题回答之间存在较大差距,强调基准测试结果不能替代真实世界测试。

4月19日 消息:近期,Hugging Face 发布了一项名为 Open Medical-LLM 的新基准测试,旨在评估生成式人工智能模型在健康相关任务上的表现。

防水拍照手机

苹果手机的生态

amd7900xt值得买吗

该基准由 Hugging Face 与非营利组织 Open Life Science AI 和爱丁堡大学自然语言处理小组的研究人员合作创建。Open Medical-LLM 的目标是标准化评估生成式人工智能模型在一系列医学相关任务上的性能。

Open Medical-LLM 并非从零开始的基准测试,而是由现有测试集(如 MedQA、PubMedQA、MedMCQA 等)拼接而成,涵盖多个医学领域,如解剖学、药理学、遗传学和临床实践。基准测试包含多项选择和开放性问题,需要医学推理和理解,涵盖了美国和印度的医学执照考试以及大学生物学测试题库的内容。

尽管 Hugging Face 将该基准视为医疗界生成式人工智能模型的 “健全评估”,但一些医学专家在社交媒体上对 Open Medical-LLM 提出了警告,指出实际临床实践与医学问题回答之间存在较大差距。他们强调,基准测试结果不能替代在真实世界条件下的仔细测试。

首家5G全连接工厂

医疗评估的侧重点

对此,Hugging Face 的研究科学家克莱门汀・弗里尔(Clémentine Fourrier)在社交媒体上表示,这些排行榜只能作为探索特定用例的第一近似值,但实际上需要进行更深入的测试阶段,以检查模型在真实条件下的局限性和相关性。她指出,医学模型绝不能单独由患者使用,而应该被训练成为医生的支持工具。

尽管 Open Medical-LLM 等基准测试具有一定的参考意义,但结果排行榜也反映出模型在回答基本健康问题时表现不佳。然而,Open Medical-LLM 和其他任何基准测试都不能替代经过深思熟虑的真实世界测试。例如,谷歌曾试图将用于糖尿病视网膜病变筛查的人工智能工具引入泰国的医疗系统,但尽管理论上准确度很高,该工具在实际测试中却表现不佳,导致患者和护士对其结果的不一致性感到沮丧,与实际临床实践缺乏协调性。

至今,美国食品药品监督管理局已批准的139个与人工智能相关的医疗设备中,没有一个使用生成式人工智能。测试生成式人工智能工具在实验室中的性能如何转化为医院和门诊诊所的实际情况,以及这些结果可能随时间变化的趋势,都是异常困难的。

官方博客:https://huggingface.co/blog/leaderboard-medicalllm


返回网站首页

本文评论
顺丰宣布保价服务2.0即将上线:定损、赔付方便了「顺丰保价服务怎么赔偿」
最近,顺丰快递因保价”的事多次登上各大平台热搜,如寄丢11000元手机仅赔1000”寄丢20克黄金保价8000只赔2000”等等。对此,顺丰回应表示,9月以来连续热搜事件,集团高度重视,即时责...
日期:10-01
LLaMA都在用的开源数据集惨遭下架:包含近20万本书,对标OpenAI数据集
声明:本文来自于微信公众号 量子位 (ID:QbitAI),作者:凹非寺 ,授权转载发布。开源数据集因侵权问题,惨遭下架。如LLaMA、GPT-J等,都用它训练过。如今,托管了它3年的网站,一夜之间删...
日期:08-22
人工智能会成为优秀的天气预报员吗「气象学家探讨人工智能对天气预测的影响 提高预测准确性」
划重点:唯品会的玩法极米newz6x什么时候上市的迅雷净利润美国电动车要驾照吗...
日期:11-10
大模型托管平台Replicate获得2.9亿元B轮融资_模型大厂
**划重点:**1. 限电 富士康尼尔机械纪元全球版和年度版...
日期:12-22
2010年百度新闻搜索榜解读(百度新闻榜单)
  在10年前,如果要总结归纳一年的新闻事件,可能需要采购全球成千上万的报纸,从海量的头版标题中归纳。但在信息时代,基于先进的新闻搜索技术和统计模型,我们能随时绘制一幅新...
日期:07-25
快手发违规视频会被怎么样「快手打击违规健康科普内容 共处置相关视频超26万个」
10 月 9 日消息,日前,快手发布关于打击违规健康科普内容的处罚公告(第八期),公告称为营造积极、健康、正能量的社区环境,向用户传递科学严谨、真实可信的健康科普内容,快手平台持续...
日期:10-11
荣耀90s「荣耀90实拍样张曝光 2亿像素大底相机优势明显」
在全系搭载2亿像素大底相机的荣耀90系列发布后,中端手机市场也正式进入到“影像新时代”。近日,荣耀90实拍样张出炉,从不同角度全面展现了这款相机在各类拍摄环境下的真实表现...
日期:06-03
又一时速350公里高铁开通在即:广州到汕尾由2小时缩短至1小时内
据中国铁路消息,2月23日11时许,广汕高铁(广州至汕尾)正线轨道铺设完成,计划在今年内具备开通运营条件。据了解,广汕高铁自广州新塘站引出,终至汕尾站,共设新塘(广州)、增城南、罗浮山...
日期:02-25
知海智库「号称和GPT-4持平!知乎大模型“知海图AI”将正式开放」
快科技11月6日消息,近日知乎宣布其知海图AI”大模型将面向公众开放,并择机上线相关产品,以提供服务给创作者、讨论场所、信息获取者以及内容运营者等各类型用户。据介绍,知海图A...
日期:11-07
月满中秋夜 三星BESPOKE缤色铂格系列产品让全家团圆更温馨_三星伯爵系列
随着中秋佳节的临近,人们心中涌动着对家的浓浓思念,期待与亲人和朋友欢聚一堂,合家团圆的时刻离不开洁净舒适的衣物、健康美味的饮食以及和谐优雅的家居美学设计。三星BESPOKE...
日期:09-27
“存算分离”已成为分布式数据库的主流方向(按数据处理空间的分布方式来分,数据处理方式可分为)
  在当前越来越强调云原生的环境下,存储计算分离已经是大势所趋。几乎所有我们熟知的云数据库都已经开始使用存算分离实现资源价值的最大化,比如阿里的PolarDB,AWS 的Aurora...
日期:05-11
与宠物沟通的软件「宠物沟通师,读懂的是谁的心?」
声明:本文来自于微信公众号 锌刻度(ID:znkedu),作者:黎炫岐,授权转载发布。“最近你在想什么呢?”“离开我们这么久了,有想我吗?”“你去世的时候很痛苦吗,有没有怨过我?”……你或许...
日期:06-24
中国移动研究院完成业界首次忆阻器存算一体芯片的端到端技术验证
2023/5/31 15:38 中国移动研究院完成业界首次忆阻器存算一体芯片的端到端技术验证   5月29日,中国移动联合清华大学完成业界首次忆阻器存算一体芯片的端到端技术验证,成...
日期:05-31
苹果严重安全漏洞冲上热搜第一:黑客能接管设备_iphone被黑客侵入
  8月20日消息,微博话题“苹果曝出严重安全漏洞”冲上热搜第一名。  就在本周,苹果公司报告了一个重大安全漏洞,该漏洞可以让黑客接管苹果设备,苹果方面呼吁用户立刻下载最...
日期:09-04
美式励志!36岁单亲硕士妈妈失业后转战Intel晶圆厂:年薪至少31万
快科技8月11日消息,半导体行业是美国正在大力补贴的产业,而且缺乏合格的工人,Intel、台积电等公司正在加大力度培训,不需要高等学位,最快10天学习完成技能认证就可以成为芯片工厂...
日期:08-11
中国 车企 市值「中国车企市值排名:比亚迪第一遥遥领先 理想超长城成国内第二」
快科技6月3日消息,NBD汽车近日统计了5月中国车企市值榜单,其中比亚迪以7384.4亿元的市值排名第一,遥遥领先。理想汽车超越长城汽车排名第二。小米4 发热日前,有博主分享了这一数...
日期:06-03
华为ADS就是强!阿维塔11单次充电爬坡535公里:全程无接管_阿维塔 华为
快科技9月23日消息,近日阿维塔11自重庆启程,开启NCA智驾系统,在全程高速行驶且海拔急剧攀升的工况下,一箱电、零接管”顺利到达康定,全程535公里,海拔爬上了2437米。重庆到康定的...
日期:09-23
上海迪士尼度假区与三星电子达成推广合作, 庆祝三星新品手机发布
上海迪士尼度假区和全球最大的科技领军企业之一——三星电子于今天共同宣布达成推广合作并庆祝三星电子于同日发布旗舰新品Galaxy S23系列。在上海迪士尼度假区和三星电子的...
日期:02-15
38小时长续航!Redmi Buds 5 Pro续航升级:快充5分钟、听歌2小时_红米buds air pro
快科技11月27日消息,小米将于11月29日19点举行新品发布会,届时除了Redmi K70系列,还将为大家带来Redmi Buds 5 Pro无线耳机。据Redmi品牌总经理卢伟冰表示,Redmi Buds 5 Pro在快...
日期:11-28
网络面临的主要安全威胁_报告显示企业面临更多网络安全威胁
  智能网络安全和数据保护解决方案的领先供应商SonicWALL公司日前发布了其2011年年中网络威胁情报报告。   报告显示,企业正面临越来越多网络犯罪分子的攻击,这些人企图...
日期:07-22