您的位置:首页 > 互联网

40年图灵机难题被业余玩家攻破,陶哲轩:软件辅助证明改变数学研究规则

发布时间:2024-09-06 19:29:14  来源:互联网     背景:

声明:本文来自于微信公众号 量子位 | 公众号 QbitAI,作者:一水,授权转载发布。

40多年的计算机难题——忙碌海狸难题,被一群业余爱好者攻破了!

数学大佬陶哲轩转发了这一消息,并欣慰表示:

这再一次体现了证明助手对于数学研究的协作是多么有用。

计算机科学家Scott Aaronson为此还写了一篇博文,并大肆赞赏:

这个发现是自1983年以来,忙碌海狸函数研究中最重要的进展。

具体而言,人们历经数十年努力,终于找到了第五个“忙碌海狸”图灵机:

BB(五) =47,176,870(5状态图灵机,能在停下来之前写下47,176,870个“1”)

图灵机是一种抽象的计算模型,通过读取和写入0和1在无限磁带上进行计算。

早在40多年前,一群计算机科学家在德国多特蒙德举行竞赛,寻找“忙碌海狸”图灵机。

找出一个特定的图灵机,在它停止之前能够写下最多的1(我们称之为忙碌海狸数)。

通过找出特定状态下能在停止前写下最多1的图灵机,我们能更好地理解计算理论的边界。

自从1974年确定了第四个忙碌海狸数后,寻找第五个成了悬而未决的问题。

而现在,来自世界各地的20多名贡献者(其中大多数人没有传统的学术资格),使用一款名为Coq证明助手的软件获得了结果——47,176,870,该软件证实数学证明没有错误。

这一成就瞬间令社区沸腾,其中爱尔兰梅努斯大学计算机科学家Damien Woods惊叹:

就像博尔特一样,我很惊讶他们的速度如此之快!

嗯,快半个世纪过去了还算快?只能说这个问题雀食有亿点难。

别着急,且看这群人如何长江后浪推前浪抓住“第5只海狸”~

iphone se plus郭明錤

为什么提出“忙碌海狸”?

要回答这个问题,首先需要简单了解一下二进制图灵机。

1936年,计算机科学之父艾伦·图灵提出了图灵机——

三星s20+参数配置防水吗?

由一个无限长的纸带,一个读写头(可以读取和写入纸带上的信息),以及一组内部状态等基本部分组成。

图灵机的行为由一组规则定义,这些规则可以想象成一张表。表中的每行代表一个规则,每列对应读写头读取到的符号(0或1)。

每条规则指定了在特定状态下,读写头遇到0或1时应该执行的操作。操作通常包括:

  • 写入符号:决定在当前单元格写入什么符号(例如,将0替换为1)。

  • 移动方向:决定读写头是向左移动、向右移动还是保持不动。

  • 状态转换:决定图灵机的下一个状态是什么。

除了处理0和1的规则外,还有一条特殊规则告诉图灵机何时停止运行。当图灵机进入这个状态时,它就不再执行任何操作,相当于“比赛结束”(这种状态一般不计算在状态集合里)。

而就在停机问题上,已经有研究观察到:

一些图灵机会相对较快地停止(比如这台three-rule图灵机在11步后停止)

其他的则陷入了很容易发现的无限循环

这也启发图灵提出了著名的“停机问题”:

图灵机是否会在有限的步骤后停止运行,或者它是否会无限期地运行下去?

他还进一步提到,停机问题没有通用的解决方案,因为人们永远无法确定适用于一台机器的方法是否也适用于另一台机器。

对于这个结论,数学家Tibor Radó(以下简称拉多)不太满意,并由此发明了“忙碌的海狸游戏”。

为了将停机问题的本质提炼成更简单的形式,拉多提出了一种方法——

将图灵机根据它们拥有的规则数量进行分组。

例如,一组代表所有只有一条规则的图灵机,另一组代表所有有两条规则的图灵机,依此类推。

1962年,拉多利用这些有限的图灵机组定义了“忙碌海狸游戏”。游戏的玩法是:

1.选择一个组,即确定你的图灵机将拥有的规则数量。

2.为组中的每台机器提供一个初始状态全是0的磁带。

3.观察这些机器的运行。一些机器可能会无限期地运行下去,而其他的则会在某个时刻停止。

4.在那些最终停止的机器中,有的会很快停止,有的则需要更多步骤。每个组中会有一个运行时间最长的机器,这台机器被称为“忙碌海狸”。

5.在有n条规则的组中,这台“忙碌海狸”在停止之前所执行的步数就是所谓的“忙碌海狸数”BB(n)。

6.游戏的目标是确定这些BB(n)的确切值。

拉多给这样“极度低效”的图灵机取了一个有趣且形象的名字:忙碌海狸(Busy Beaver,取自英语中的谚语 as busy as a beaver)。

而这个游戏也最终引来一众程序员和数学爱好者的疯狂试玩。

早期吃螃蟹的人

Allen Brady(以下简称布雷迪),当时的俄勒冈州立大学数学研究生,成了早期挑战者之一。

在游戏推出前,人们已经确定了BB(1) =1,BB(2) =6,当时人们正尝试攻克BB(三)。

布雷迪也投身BB(三),他编写了计算机程序来模拟图灵机的行为,这个程序构建了一种“家谱”,根据图灵机初始行为的相似性,对具有相同规则数量的机器进行分类。

程序只在机器之间行为差异变得重要时才将家谱树分成多个分支。如果模拟显示某条分支上的机器会停止或进入无限循环,程序就会剪掉这个分支,排除那些不会无限运行下去的图灵机。

编写程序只是第一步,布雷迪需要找到足够强大的计算机来运行它。

在1964年,这不是一件容易的事。最终,他在90英里外的灵长类动物研究实验室找到了一台SDS920计算机。

只可惜BB(三)进行到一半,拉多的研究生Shen Lin已宣布证明BB(三) =21,不过布雷迪还是继续证实了Lin的结果。

毕业后,布雷迪发现了新的非停止图灵机种类,并给它们起了形象的名字。

1966年,他发现了一个在停止前运行了107步的四规则图灵机,并推测这可能是第四个忙碌海狸,并最终于1974年证明了没有其他停止的机器能运行更久。

这是四十多年来人类所知的最后一个忙碌的海狸号码

1982年,第一次大规模寻找BB(五))的Dortmund竞赛正式举办,其中运行时间最长的一台在超过10万步后停止。

1984年,《科学美国人》对这项比赛的报道激发了新一代研究者的兴趣,有一位研究者打破了旧纪录,他发现的一台机器在超过200万步后停止。

潮宏基花丝镶嵌案例

这一新纪录也引来当时的研究生Heiner Marxen和 Jürgen Buntrock,他们在业余时间合作研究这个问题,开发了加速图灵机模拟的数学技术。

尽管未能打破200万步的纪录,但后来在1989年,Marxen在一家公司工作时,使用一台功能强大的新计算机重新启动了他的搜索程序,并意外地发现了一个在4700万步后停止的图灵机。

2000年代初,一位名叫Georgi Ivanov Georgiev(化名Skelet)的保加利亚计算机科学家非常接近这一目标。

经过两年的不懈努力,他开发了一个能够识别非停止机器新种类的计算机程序。尽管他的程序运行了一周并留下了约100个未解决的图灵机,但他手工分析后将名单减少到43个。

此后人们一直陷入不断尝试中。

最终确定BB(五)

2022年,研究生Tristan Stérin发起了“忙碌海狸挑战”,这是一项在线合作,旨在最终确定BB(五)。

在这之前,Stérin决定在传统方法的基础上进行调整,使用布雷迪的家谱方法,并计划用独立程序处理永远运行的机器。

到2021年底,Stérin编写了第一步的计算机程序,生成了大约1.2亿台可能的图灵机列表。

为了帮助分析这些机器,Stérin构建了一个在线界面,使用“时空图”来可视化图灵机的行为。

完成这些后,鉴于个人精力有限,他在偶然的情况下拉来了Shawn Ligocki。

Ligocki向团队介绍了封闭磁带语言方法,这是一种30年前的技术,他将其应用于当前的忙碌海狸问题。

他写了一篇博客文章介绍这项技术,但最初并不知道如何编写一个能涵盖所有情况的程序。

然后,又一位Justin Blanchard加入了项目,他想出了如何做到这一点,但他的程序相对缓慢。

于是另外两个贡献者找到了让它运行得更快的方法,这一技术甚至可以处理前文提到的43个未解决图灵机中的10个。

取得阶段性成果后,BB(五)终于迎来两个关键突破。

第一个是Skelet #1,它在可预测行为和混乱行为之间不断交替,这种特性使得它非常难以分析和理解。

2023年3月,Ligocki和斯洛伐克贡献者Pavel Kropitz(不会说英语,使用谷歌翻译与团队其他成员交流),使用Marxen和Buntrock(之前挑战200万步记录的两位学生)30年前的加速模拟技术的一个增强版,最终破解了Skelet #1。

他们发现Skelet #1在超过一万亿步之后才进入一个异常长的重复周期,远超过一般无限循环在1,000步内开始重复的常规。

由于Skelet #1的行为极其奇怪,Ligocki在将近五个月的时间里都不确定他们的证明结果是否正确。

后来,一位21岁自学成才的程序员(以“mei”为名)加入了团队,她通过学习Coq证明助手,将团队的一些证明翻译成Coq语言,提高了证明的严格性和可靠性。

第二个突破是Skelet #17,研究者必须像破译四层加密的秘密消息一样,逐层解析其行为模式,才能证明该机器永远不会停止。

尽管研究生Chris Xu和其他社区贡献者做了大量工作,但大多数证明尚未翻译成Coq。

直到2023年4月,一位名为mxdys的神秘新贡献者加入,并在短短几周内完成了一个40,000行的Coq证明,证实了BB(五) 的值。

mxdys证明第五台忙碌海狸在4700万步后停止,确认了Marxen和Buntrock的发现。

Coq专家Yannick Forster审查了证明,他激动表示:

我仍然感到非常震惊。

超极本缺点

故事仍未结束

BB(五)终于确认了,目前相关研究者正在起草一份学术论文,这将是一个补充mxdys的Coq证明的人类可读版本。

但是,BB(五)已确认,BB(6)还会远吗?

mxdys和另一位贡献者Racheline发现了一个六规则的图灵机,其停机问题与著名的数学难题“科拉茨猜想”相似。

为了避免让大家头疼,此处不再展开这个猜想,各位看官只需要知道它非常难就行。

以至于著名理论计算机科学家Scott Aaronson发出感慨:

BB(五)也许是我们所知道的最后一个忙碌的海狸号码

嗯?这话有点耳熟,BB(四)好像也是这样说的。

参考链接:

[1]https://www.quantamagazine.org/amateur-mathematicians-find-fifth-busy-beaver-turing-machine-20240702/

[2]https://news.ycombinator.com/item?id=40857041

[3]https://scottaaronson.blog/?p=8088

—完—


返回网站首页

本文评论
抖音电商:带货达人不得通过演戏炒作宣传商品价格「抖音电商带货的规定」
3月9日消息,据抖音电商微信公众号消息,今日,《抖音电商创作者价格宣传行为规范》(下称“规范”)经修订后正式生效。规范明确规定,商品价格宣传时,不得利用家庭或团队矛盾、与品牌方...
日期:03-09
今天下午2点!Wi-Fi 7线上研讨会“龙”重登场
通信世界网消息(CWW)当前4K/8K视频、VR游戏、远程医疗等应用层出不穷,不断加速向人们的生产、生活渗透,这些全新的应用场景需要强大的网络能力予以支撑;家庭用户的移动终端数量也...
日期:01-23
奈飞游戏不温不火_奈飞怎么玩
  来源:经济日报严钰蓉 360金融  当地时间9月26日,奈飞宣布将在芬兰首都赫尔辛基开设一家游戏开发工作室,为会员提供没有广告、没有应用内购买的原创游戏。据悉,这是奈飞首...
日期:10-03
官方紧急回应 小红书崩了_平台被曝可领养孩子
【】5月21日消息,今日,博主@上官正义在微博爆料称,小红书长期存在所谓送养孩子、领养孩子,贩卖出生证及上户口等违法行为,引发广泛关注。下午,“小红书崩了”登上微博热搜,热搜榜最...
日期:05-22
惠心海外专营店是正品吗「技术先行丨美国惠心大药厂以何为立足之本?」
科学技术是第 一生产力,各行各业皆是如此。美国惠心大药厂(American Care Medical Manufactory)能够在短时间内发展成为行业标杆,其掌握的高端技术发挥了至关重要的作用。惠心大...
日期:09-21
《速度与激情9》伦敦片场曝光  范·迪塞尔改玩中国电动车?_速度与激情9范迪塞尔小时候
  对于速激迷来说,《速度与激情9》的定档可谓一波三折。从原定的2019年4月推迟到2020年4月,再推迟到2020年5月22日,不知最后是否还会产生变数。但令人开心的是,主演范·迪塞...
日期:12-06
AI 视频编辑器Dumme:几分钟就能将YouTube长视频变成短视频
6月5日 消息:Dumme 是一家由 Y Combinator 支持的初创公司,该公司一直在利用 AI 将较长的 YouTube 视频转换为较短的视频。该公司有数百名视频创作者在测试其产品,还有20,000多...
日期:06-06
极氪001售价公布「极氪001宣布限时降价3万-3.7万元 优惠后26.9万元起」
8月11日 消息:极氪汽车宣布其001车型降价3万 -3.7万元,起售价降至26.9万元,并且部分车型还附赠7kW 智能家充服务套餐。火车票预售期15天 新闻具体降价情况如下:360路由器拆解-...
日期:08-11
qq音乐vip电视能用吗「曝QQ音乐电视端单独收费为灰度测试:未来逐步普及」
快科技1月17日消息,日前,有网友反馈称,QQ音乐电视端发布通知,QQ音乐电视端会员功能已从豪华绿钻升级至电视端独立会员。这意味着QQ音乐电视端会员将实行单独付费。使命召唤透视...
日期:01-17
“AI教父”频发警报:人工智能比气候变化的威胁更紧迫「ai+人工智能」
·“随着气候的变化,很容易推荐你应该做什么:你只要停止燃烧碳。如果你这样做,最终一切都会好起来的。但对于这个(AI),你根本不清楚应该做什么。”·“生物智能”在信息传递方面“...
日期:05-07
抖音对比b站「继淘宝、美团之后,抖音这次挑战B站你看好吗?」
声明:本文来自于微信公众号 蝉妈妈(ID:cmmshuju),作者:蝉妈妈,授权转载发布。科技谷歌将发布pixel7系列手机抖音又有新动作了!近日,抖音上线一个属于年轻人的兴趣知识视频平台“...
日期:03-25
开问界M9回安徽老家 余承东成了全村之光:掏钱修路 送祝福等
2月12日消息,春节期间,有网友在社交媒体晒出余承东开问界M9回安徽老家的照片,还有网友争相晒出跟余承东的合影。三星折叠手机zflip4动力电池回收技术现状和发展趋势过去几年春...
日期:02-12
“万里舷窗”吸睛!iQOO 12赛道版图赏_iqoo 5赛道版
快科技11月6日消息,iQOO 12系列将于明晚正式发布,现在外观已经抢先解禁。现在iQOO 12已经来到我们评测室,下面为大家带来图赏。iQOO 12提供了赛道版、传奇版、燃途三种配色,我们...
日期:11-07
山寨手机系统didoOS「山寨手机」
,指的是模仿知名品牌手机外观和功能,但是在品质、性能和安全性上却存在风险的手机产品。这种手机在中国非常普遍,以致于成为一种独特的文化现象。在这篇文章中,我们将了解的背景...
日期:06-01
开放5G网络能力,使能5G更大的商业成功「中国开放5g的频段」
[中国,深圳, 2023 年 4 月 20 日] 5G发展 4 年,领先的运营商已获得商业成功,并将走向更大的商业成功。“5G商业成功session”在 2023 年分析师大会期间举办。华为无线首席战略官...
日期:04-21
机器人流程自动化应用实例「机器人流程自动化能力评估体系相关行标发布」
通信世界网消息(CWW)2023年8月,工业和信息化部公告(2023年第17号)批准发布了多项行业标准,由中国通信标准化协会提出并归口,中国信息通信研究院(简称“中国信通院”)牵头制定的YD/T 4...
日期:01-17
前“京东副总裁”开播带货,销售额破亿,曾被质疑博流量_京东新上任副总裁
声明:本文来自微信公众号“电商在线”(ID:dianshangmj),作者:刘奕琦,授权转载发布。12月14日,“蔡磊破冰驿站”(以下简称“破冰驿站”)的粉丝数量突破了250万。看到这个数据时,他和...
日期:12-27
amd radeon hd 7900「AMD RX 7900得救了!升级驱动 功耗骤降90W」
AMD RX 7900系列发布之后,无论性能还是功耗、温度表现都不尽如人意,远未达到预期,全新的RDNA3 GPU架构似乎不应该如此拉胯。华硕中国市场份额当然,我们知道,A卡一直有战未来的传...
日期:01-14
美媒:印度500万程序员将面临AI冲击「印度程序员收入」
4月17日消息,如果ChatGPT这样的技术取代了软件工程师,那么印度将受到最大的冲击,该国拥有超过500万的程序员。虽然这种可能性非常遥远,但像Palash Hade这样的人也会整夜失眠。这...
日期:04-17
让开源真正开放,助力企业激活无限创新,第四届ECIC圆满落幕
  云原生正以不可撼动之势融入到行业中去。那么,如何让开源真正开放,成为业内关注的问题。   云原生是一套指导软件架构设计的方法论、工具和最佳实践,它使得开发的软件...
日期:07-17