您的位置:首页 > 互联网

21岁SpaceX实习生用AI干出重大考古事件,斩获40000美元!_spacexceo

发布时间:2023-10-16 10:25:36  来源:互联网     背景:

声明:本文来自于微信公众号 量子位(ID:QbitAI),作者:金磊,授权转载发布。

长城皮卡车汽车之家

2000年前的古卷轴(赫库兰尼姆卷轴),终于被一个21岁计算机少年给破译了。

这个古卷轴可以说是极其的特殊——

在公元79年被一场火山爆发掩埋碳化,直到1752年才被挖掘出土。

而且由于古卷轴本身已经太脆弱了,数百年来没人敢动它,处理稍微不当就可能化作尘埃的那种。

(注:赫库兰尼姆城和著名的庞贝古城相距8公里,位于意大利那不勒斯东南的维苏威火山脚下;前者比庞贝古城更接近火山口。)

那么如何看到它上面记载了什么内容,就成了困扰科学家们数百年的老大难问题。

现如今,随着这位计算机少年成功的破译,使他成为了2000年来第一个从未打开卷轴,却“看”到了上面文字的人。

这项任务其实是来自一个叫做维苏威火山的挑战赛(Vesuvius Challenge):

要求参赛者在卷轴的4平方厘米区域内,至少找到10个字母。

这位少年作为完成任务的第一人,也被活动官方授予了40000美元的首字母奖(First Letters Prize)。

很多小伙伴肯定好奇,少年破译的文字到底是什么,不卖关子,直接揭晓谜底:

是古希腊语πορφυρας,意思是紫色染料或者紫色的衣服。

在结果出炉之后,比赛的赞助者、科技企业家Nat Friedman还手动at了马斯克,很骄傲地介绍这位少年:

他是你们SpaceX的实习生!

破解数千年古卷轴,AI立大功

这位少年名叫Luke Farritor(下文简称卢克),是一位计算机专业学生。

而在讲这位“屠龙少年”的故事之前,我们还需要铺垫一下关于这个比赛的背景。

早在2019年,肯塔基大学EduceLab的Brent Seales教授,便在粒子加速器中,对赫库兰尼姆卷轴进行了成像工作,并生成了分辨率高达4μm的3D CT扫描。

△Seales教授和团队在粒子加速器上扫描

这位教授的博士生Stephen Parsons,长期致力于使用机器学习模型检测CT扫描中的墨水。

于是他和他的团队扫描并拍摄了带有可见墨水的分离卷轴碎片,从而提供了一个ground-truth数据集。

△来自Stephen的博士论文:在ground-truch数据集上训练机器学习模型

这项研究成功引起了科技企业家Nat Friedman和Daniel Gross的注意;于是乎,在二人的赞助之下,便发起维苏威火山挑战赛。

他们在今年三月发起公开竞赛,设置总奖金为70000美元,目的就是加速破译古卷轴。

space scientist

到了今年八月份的时候,一位叫做Casey Handmer的学者写了一篇博客,讲述了他所发现的看起来像墨水的“裂纹模式(crackle pattern)”。

这可以说是一个非常重要的突破进展,即使是Stephen,此前也只是在分离的碎片上看到过墨水的直接证据,但还没有在卷轴上看到过。

然后卢克在一场播客中,偶然听到了这个消息和挑战赛,也看到了Casey的裂纹模式在Discord上被广泛讨论。

这就引起了卢克非常大的兴趣,并开始利用晚上的时间,着手训练一个关于“裂纹模式”的机器学习模型。

在训练的过程中,他前前后后发现了几十个墨迹比划,还有一些完整的字母,卢克对它们做好了标记并作为训练数据。

△左:在纸莎草纤维背景下可以看到有裂纹的墨水;右:生成的二进制墨水标签。

电脑桌面自动出现屏保怎么删除

没过多久,模型就露出了肉眼看不见的裂纹痕迹;这些痕迹成了最后形成字母和实际单词的线索。

space scientists

下面这张图便是卢克向挑战赛提交的一个作品,隐约可以看到“ΠΟΡΦΥΡΑϹ”(porphyras)的单词形状,

当Seales教授和团队看到这张图的时候惊叹道:

尽管字母很模糊,但他们可以立即读出“porphyras”这个词。

这个单词在古代文献中也并不是很常见,但是也是经得起推敲,大概意思就是“紫色的”。

一位专家解释说:

序列πορφυ̣ρ̣ας̣ ,可能是πορφύ̣ρ̣ας̣(名词,紫色染料或紫色布)或πορφυ̣ρ̣ᾶς̣(形容词,紫色)。

由于缺少上下文,也布排除是 πορφύ̣ρ̣α ς̣κ[ 或 πορφυ̣ρ̣ᾶ ς̣κ[ 。

值得注意的是,古代的单词和现代不同,那时候的文本没有空格,因此单词的边界确定起来也是比较困难。

space scientist

最终挑战赛官方认为,卢克值得获得首字母奖;而他本人在得知这一消息的时候也非常激动:

另一位研究生也有相同的发现

无独有偶,在Casey和卢克的工作激励之下,另一位参赛者,来自柏林Egyptian biorobotics的研究生Youssef Nader,采用了不同的方法也得到了相同的结果。

他筛选了Kaggle上墨水检测奖的获奖作品,该奖项的重点是改进Stephen Parsons在分离片段中进行机器学习的方法。

马云寄语2019

在此基础上,他采用了域转移技术使这些模型适应古卷轴:对卷轴数据进行无监督预训练,然后对片段标签进行微调。

使用Kaggle竞赛的这个修改模型,他设法找到了一些字母,尽管完全不依赖于Casey手动寻找裂纹的方法。然后,他将看起来像字母形状的东西注释到标签数据中。

△左:Youssef工作的最早的图像;右:他的第一组假设墨水标签。

在反复的优化之下,Youssef向官方提交的作品如下:

最终,Youssef获得了首字母奖的二等奖,10000美元。

专家们在看到Youssef的工作之后,更加确认了卢克发现的古卷轴中的文字。

他们甚至开始推测上面和下面的单词,可能是ανυοντα(实现)和ομοιων(类似)。

而就在前几天,Youssef的模型产生了更为惊人的结果:

在这张图中,你可以清楚地看到四列半的文本,用一定的边距隔开。

尽管并非所有字母都能被专家们立即辨认出来,但起码可以看到更多的字母了。

官方表示,专家们正在做进一步的调研,很快将会有新的结果。


返回网站首页

本文评论
Watch新专利检测到未认证表带可禁用服务 第三方表带危险了_Apple
对于不少用户来说,给智能手表换表带,几乎就和给手机还手机壳一样普通,甚至有人会准备多条表带,根据服装和出行需求的不同进行选择。二类事业编制待遇但对于Apple Watch的用户来...
日期:09-18
多国大使馆点赞百度健康,科技战疫彰显大国本色!
  突如其来的新冠肺炎疫情又一次将14亿中国人的心紧紧地团结在了一起。在经过无数专家、医护工作者、军人的逆行抗争和人民群众的积极抗疫后,国内的疫情控制效果明显,多地...
日期:03-13
放假一天不调休!2023清明节假期火车票今日开售「2021清明节火车票」
今年清明节是4月5日,按照官方此前公布的放假安排,只休息4月5日(周三)一天。根据铁路客票预售期15天的规定,今日可以购买清明节当天的火车票,有出行计划的同学,可以登录12306网站、...
日期:03-23
华为手机连续五年登录春晚!华为Mate50以及P50 Pocket亮相小品节目中
中关村在线消息:手机已经成为了现代生活中必备品,在贴近生活中的春晚小品中,手机经常作为道具出现在小品当中。在今年的兔年小品中,细心的观众可能发现了华为多款热销的智能手机...
日期:01-22
生成式人工智能新规今日实施:不得侵害他人信息隐私_生成式人工智能技术概述
快科技8月15日消息,今年7月,国家网信办联合国家发展改革委、教育部、科技部、工业和信息化部、公安部、广电总局公布《生成式人工智能服务管理暂行办法》(以下称《办法》)。根据...
日期:08-16
特斯拉降价可以要求赔偿吗「国产特斯拉大降价后车主维权 能拿到四项补偿?回应来了」
没想到特斯拉2023开年暴击”竟是国产车型全系大降价,由于这是在毫无征兆的情况下宣布的降价,一些刚提车的车主自然坐不住了,从网上曝光的信息来看,多地车主已开始自发组团维权。...
日期:01-08
荣耀80 Pro直屏版即将开售:3599元 比曲屏便宜「荣耀20pro曲面屏」
去年11月,荣耀发布新一代数字旗舰荣耀80系列,带来荣耀80、荣耀80 Pro,后者采用一块1.5K视网膜级曲面屏。新机发布后,有爆料称,荣耀80 Pro还有一款直屏版机型,将在2023年年初上市。...
日期:01-03
亚马逊或于今年年底与欧盟反垄断监管机构达成和解_欧盟反垄断委员会
11月26日消息:据彭博社报道,知情人士透露,亚马逊有可能在今年年底解决欧洲监管机构发起的反垄断调查。卫视广告2017知情人士表示,欧盟委员会「很可能在年底前接受亚马逊的约束...
日期:11-28
facebook手机版本_Facebook推出低端手机应用 支持逾2500种机型
  北京时间1月20日消息,据国外媒体报道,Facebook与移动应用开发商Snaptu共同推出了一款面向普通功能手机的Facebook应用,并从即日起提供90天的免费数据服务。   Facebook...
日期:07-25
山姆泡面桶已被炒至1999元一桶 网友:这泡面是加了神仙水吗?「山姆的泡芙多少钱一桶」
最近,深圳最大的山姆旗舰店(Sam's Club)开业,推出了一款名为“合味道泡面桶”的商品,引发了疯狂的抢购潮。这款泡面桶造型夸张,高达45厘米,售价168元,每人限购2桶。在二手平台上,该泡...
日期:07-03
兼容 AI 个人电脑将改变人们的工作方式:大大提高性能、安全性和个性化
9月28日消息:日前 Canalys 发文章表示,兼容 AI 的新一代个人电脑将改变我们的工作方式。混合云计算和本地计算将使人们能够大幅提高工作效率,释放自身的创造力。这将推动向AI...
日期:09-28
马斯克1.55亿粉丝中付费订阅者仅4万名,占比0.025%_马斯克悬赏1亿
9月8日消息,长期以来,社交网络X(前身为推特)就始终试图通过为用户提供各种货币化工具,如Ticketed Spaces、Tips等,在创作者经济中分一杯羹。X的一个较新工具名为订阅(Subscriptions...
日期:09-08
施耐德电气:数字化和创新型人才看过来「技术链接服务加速“数实融合”,施耐德电气四赴服贸之约」
(原标题:技术链接服务加速“数实融合”,施耐德电气四赴服贸之约) 以“开放引领发展,合作共赢未来”为主题的2023年中国国际服务...
日期:09-05
熬夜真凶找到了 近七成晚睡是因为手机「晚上熬夜看手机会猝死吗」
中关村在线消息:熬夜已经成为了当代年轻人的标配,长期熬夜会使身体处于亚健康状态,最终导致多种疾病发生。调查显示,近七成晚睡都与一个东西有关,那就是手机。玩手机、追剧、打游...
日期:10-24
智驾功能将在这5城开放!余承东最新发文「智驾汽车科技有限公司」
6月28日,余承东发布微博称,问界M5智驾版率先搭载了HUAWEI ADS 2.0高阶智能驾驶方案,很多媒体和用户在体验了这款车的智能驾驶以后,都说它是“智驾天花板”,无论是转弯、变道、还...
日期:06-29
韩国有6g网络了吗「韩国6G商用技术及核心部件研发最快明年启动 预算4400亿韩元」
8月24日消息,据外媒报道,在2019年率先推出5G商用服务的韩国,也是全球较早开始6G技术研发的国家,在5G商用服务推出之前的几个月,LG电子就在韩国科学技术院内设立了6G研发中心,与韩...
日期:08-25
已在业务场景中投用数万片 腾讯披露自研芯片“沧海”最新进展
新浪科技讯 4月17日午间消息,近日,腾讯披露自研编解码芯片“沧海”最新进展。据了解,沧海芯片已在业务场景中投用数万片,服务腾讯自研业务及公有云客户。 据介绍,在SSIM (结构相...
日期:10-02
特斯拉因种族歧视被判赔偿超300万美元,曾一度被判赔1.37亿_特斯拉赔偿事件
4月4日消息,一名前电梯操作员奥文·迪亚兹(Owen Diaz)在特斯拉公司工作期间遭遇种族歧视,旧金山联邦陪审团裁定特斯拉需向他支付300万美元的惩罚性赔偿和17.5万美元的非经济损害...
日期:04-04
华为Mate50系综合实力并不突出, 为啥能够如此大卖!「华为不会再有mate50了么」
华为mate50首发销量喜人,综合实力并不突出,为何能如此大卖?华为Mate50系列手机大卖很正常,很多人都憋坏了!别小看了华为手机的影响力,毕竟曾经也是登上了全球销量榜单的王者,后来为...
日期:09-27
上海迪士尼:重启握手拥抱合影 游客可近距离互动「上海迪士尼组队」
3月6日 消息:上海迪士尼度假区宣布,根据相关指导意见和全球迪士尼乐园的成功经验,将逐步恢复与迪士尼朋友的近距离互动。游客可以与喜爱的迪士尼朋友亲切互动,签名和进餐体验也...
日期:03-06