您的位置:首页 > 互联网

陶哲轩全网悬赏最强大脑!AI+人类颠覆数学难题?凡尔赛网友已下场

发布时间:2024-09-30 14:54:19  来源:互联网     背景:

声明:本文来自于微信公众号 新智元,作者:Aeneas 好困,授权转载发布。

【新智元导读】最近,陶哲轩向广大网友和数学爱好者发起了挑战:大众数学爱好者、证明助理、自动化助手和AI联合起来,是否可以证明扩展几个数量级的数学问题?

想参加陶哲轩发起的众包数学研究项目吗?

机会来了!

AI辅助证明数学研究,越来越可行了

在传统上,一个数学研究项目通常是由1到5名数学专家来完成的。

他们每个人都对项目的各方面都足够熟悉,可以验证彼此的贡献。

但如果要组织起更大规模的数学研究项目,特别是涉及公众贡献的项目,就麻烦多了。

原因在于,很难验证所有人的贡献。

2023年底,陶哲轩宣布:将多项式Freiman-Ruzsa猜想的证明形式化的Lean4项目,在三周后取得了成功(图为最新状态)

要知道,在数学论证某个部分中的单个错误,可能就会使整个项目失败。

而且,以一个典型数学项目的复杂程度来说,期待具有本科数学教育水平的公众做出有意义的贡献,也是不现实的。

由此我们也可以知道,把AI工具纳入到数学研究项目中,也是极有挑战性的。

因为AI会生成看似合理但实际上毫无意义的论证,因此需要额外验证,才能将AI生成的部分添加到项目中。

好在,证明辅助语言(比如Lean)提供了潜在的方法,能够克服这些障碍,并且让专业数学家、广大公众和AI工具的合作成为可能。

这种方法的前提是,项目可以以模块化的方式分解成更小的部分,这些部分可以在不必理解整个项目的情况下就能完成。

目前的例子主要有将现有数学结果形式化的项目(比如对Marton最近证明的PFR猜想的形式化)。

这些形式化工作,主要是通过众包方式由人类贡献者(包括专业数学家和感兴趣的公众)完成的。

同时,还有一些新兴的尝试,试图引入更多的自动化工具来完成,后者包括传统的自动定理证明器,以及更现代的基于AI的工具。

马斯克超级高铁进站

探索全新数学问题,成为可能

并且,陶哲轩还认为,这种全新范式不仅可以用于形式化现有的数学,还可以用来探索全新的数学!

过去,他曾经和继任组织过一个在线协作Polymath的项目,就是一个很好的例子。

不过,这个项目没有将证明辅助语言纳入工作流,贡献就必须由人类主持人管理和验证,这项工作非常耗时,也限制了将这些项目进一步扩大。

现在,陶哲轩希望,添加证明辅助语言能突破这个瓶颈。

而他尤其感兴趣的,就是是否可能使用这些现代工具同时探索一类数学问题,而不是一次只关注一两个问题。

本质上,这种方法是可模块化的重复任务,如果有适当的平台来严格协调所有贡献,众包和自动化工具可能会尤其有用。

如果用以前的方法,这种数学问题类型是无法扩大规模的。除非在多年时间里,随着个别论文慢慢地一次探索一个数据点,直到对这类问题获得合理的直觉。

此外,如果有一个大型问题数据集,可能有助于对各种自动化工具进行性能评估,并且比较不同工作流程的效率。

这类项目最近的一个例子,是忙碌海狸挑战。

在今年7月,第五个忙碌海狸数被证实为是47,176,870。

一些更早的众包计算项目,比如互联网梅森素数大搜索(Great Internet Mersenne Prime Search, GIMPS),在内在精神上跟这些项目也有些类似,尽管它们使用的是更传统的工作量证明机制,而不是证明辅助语言。

陶哲轩表示,很想知道是否还有其他现存的众包项目探索数学空间的例子,以及是否有可用的经验教训。

陶哲轩提出新项目

为此,陶哲轩自己也提出了一个项目,来进一步测试这一范式。

这个项目受到去年MathOverflow问题的启发。

不久后,陶哲轩在自己的Mathstodon上,对它进行了进一步讨论。

这个问题属于泛代数(universal algebra)领域,涉及对原群(magma)的简单等式理论的中等规模探索。

原群是一个配备了二元运算

的集合G。

最初,这个运算o没有附加任何额外的公理,因此原群本身是较为简单的结构。

当然,通过添加额外的公理,如恒等公理或结合律公理,我们可以得到更熟悉的数学对象,例如群、半群或幺半群。

在这里,我们感兴趣的是(无常数的)等式公理。这些公理涉及由运算o和G中的一个或多个未知变量构建的表达式的相等性。

此类公理的两个熟悉的例子,是交换律x o y = y o x和结合律(x o y) o z = x o (y o z)。

其中x,y,z是原群G中的未知变量。

另一方面,(左)恒等公理e o x = x在这里不被视为等式公理(equational axiom),因为它涉及一个常数e ∈ G。这类涉及常数的公理在本研究中不予讨论。

接下来,为了阐明自己发起的研究项目,陶哲轩介绍了十一个关于原群的等式公理例子。

这些等式公理是仅涉及原群运算和未知变量的等式——

因此,举例来说,等式7表示交换律公理,而等式10表示结合律公理。

常数公理等式1是最强的,因为它限制了原群G最多只能有一个元素;与之相反,自反公理等式11是最弱的,所有原群都满足这一公理。

接下来,我们就可以探讨这些公理之间的推导关系:哪些公理能推出哪些公理?

例如,等式1可以推导出这个列表中的所有其他公理,而这些公理又可以推导出等式11。

等式8作为特殊情况可以推导出等式9,而等式9又作为特殊情况可以推导出等式10。

这些公理之间完整的推导关系可以用以下哈斯图(Hasse diagram)来描述:

这一结果特别回答了数学问答网站MathOverflow上的一个问题:是否存在介于常数公理(等式1)和结合律公理(等式10)之间的等式公理(equational axioms)。

值得注意的是,这里大多数的蕴含关系都很容易证明。然而,其中存在一个非平凡的蕴含关系。

这个关系是在一个与前述问题密切相关的MathOverflow帖子回答中得到的:

命题1:等式4蕴含等式7

证明:假设G满足等式4,因此

对所有x,y ∈ G成立。

特别是,当y = x o x时,可以得出(x o x) o (x o x) = (x o x) o x。

再次应用(1),可以得出x o x是幂等的:

现在,在(1)中将x替换为x o x,然后使用(2),可以得出(x o x) o y = y o (x o x)。

尤其,x o x与y o y是可交换的:

此外,通过两次应用(1),可以得到(x o x) o (y o y) = (y o y) o x = x o y。

因此,(三)就可以简化为x o y = y o x,这就是等式7。

上述论证过程的形式化,可以在Lean中找到。

然而值得注意的是,确定一组等式公理是否决定另一组等式公理的一般问题,是不可判定的。

因此,这里的情况有点类似于忙碌海狸挑战,即在某个复杂点之后,我们必然会遇到不可判定的问题;但在达到这个阈值之前,我们仍有希望发现有趣的问题和现象。

苹果谈在印生产iphone14pro

上面的哈斯图不仅断言了列出的等式公理之间的蕴含关系,还断言了公理之间的非蕴含关系。

例如,如图所示,交换公理等式7并不蕴含等式4公理(x + x) + y = y + x。

要证明这一点,只需找出一个满足交换公理等式7但不满足等式4公理的原群的例子。

比如,在这种情况下,我们可以选择自然数集N,其运算为x o y := x+y。

更一般地,该图断言以下非蕴含关系,这些关系(连同已指出的蕴含关系)完整描述了这十一个公理之间蕴含关系的偏序集:

在此,陶哲轩邀请读者提出反例,来完成其中的部分证明。

苹果手机收到1000天前的信息

最难找到的反例,就是等式9无法推出等式8了。

用Lean可以给出解决方案。

另外,陶哲轩还提供了一个GitHub存储库,包含了所有上述包含和反包含关系的Lean证明。

可以看出,仅仅计算11个等式的哈斯图就已经有些繁琐了。

而陶哲轩提出的项目,是尝试将这个哈斯图扩展几个数量级,覆盖更大范围的等式集。

他提议的集合是ε,即最多使用原群运算o四次的等式集,直到重新标记和等式的自反性和对称性公理。

这包括了上述十一个等式,但还有更多。

还有多少呢?

回想一下,卡特兰数C_n是用二元运算o(应用于n+1个占位符变量)形成表达式的方法数;而给定m个占位符变量的字符串,贝尔数B_m是为这些变量分配名称的方法数(可以重新标记),其中允许某些占位符被分配相同的名称。

因此,忽略对称性,最多涉及四次运算的等式数量是

左侧和右侧相同的等式数量是

这些都等同于自反公理(等式11)。

剩下的9118个等式由于等式的对称性成对出现,所以ε的总大小是

陶哲轩表示,自己还没有生成这样恒等式的完整列表,但他猜想,使用Python就可以轻松完成。

使用AI工具,应该能生成大部分所需的代码。

他表示,自己完全不清楚ε的几何结构会是什么样子。

大多数等式会彼此不可比较吗?它会分为强公理和弱公理吗?

现在,陶哲轩的留言区,已经有了几十条评论。

感兴趣的读者,陶哲轩也向你发出了邀请。


返回网站首页

本文评论
对标千元级耳机!真我Buds Air5 Pro无线耳机官宣_真我budsq蓝牙耳机怎么样
快科技5月5日消息,今天,realme真我官方宣布,除了真我11Pro 外,还将在5月0日推出一款新的TWS无线耳机:真我Buds Air5Pro。根据官方介绍,真我Buds Air5Pro将是真我旗下目前定位最高...
日期:05-05
闪剪APP在哪下载 闪剪怎么样才能免费用_闪聊app官方下载
抖音数字克隆人、虚拟主播,让你的创业之路更轻松。小编亲测推荐一款神奇的抖音营销工具——闪剪智能剪辑软件。这款软件的功能强大到令人难以置信,除了最引人注目的Ai机器人、...
日期:12-27
小米手机地震预警在手机静音时会响吗?「小米手机地震预警为何默认关闭?高管解答:避免不必要恐慌」
快科技8月7日消息,日前山东德州市平原县发生5.5级地震,震源深度10千米。苏宁火爆l001从网友的反馈来看,这次的地震多地有震感,除了山东之外,北京、天津、河北、江苏、河南等地都...
日期:08-07
「优先选购权入手新机快人一步 「京东A+会员有机会抽取iPhone15系列」」
来源:中关村在线近日,iPhone15系列新品发布,不少消费者想要第一时间尝鲜,但以往每年新品上市初期,热门机型都比较难买,官网下单也要等很长时间才能发货。为提升消费者的新机购买体...
日期:09-15
抖音推出“抖音端内在线履约”功能「抖音平台的规定」
10 月 11 日消息,抖音电商日前发布了关于教育培训抖音端内在线履约功能及迁移公告。公告称,随着用户对于购买课程、课程学习等流程体验要求不断提高,目前,抖店购买课程需去其他...
日期:10-28
OPPO天玑之王!Find X7蓄势待发:天玑9300加持_oppo6天玑900
快科技12月11日消息,博主数码闲聊站暗示,OPPO Find X7标准版搭载联发科天玑9300芯片,后置5000万主摄、5000万超广角和6400万潜望长焦,其中主摄是索尼LTY808。其中天玑9300抛弃了...
日期:12-11
谷歌硬刚GPT-4o,60秒视频生成模型虽迟但到,还把上下文窗口卷到了200万
声明:本文来自微信公众号“量子位”(ID:QbitAI),作者:关注前沿科技,授权转载发布。OpenAI出手再次惊艳世界,谷歌果然坐不住了。GPT-4o掀起的一片“AGI已至”的惊呼声中,刚刚,Google...
日期:05-15
太二酸菜鱼大众点评优惠券「太二酸菜鱼回应遭大众点评下架 正与平台方积极沟通」
在大众点评上搜索不到太二酸菜鱼的信息,引起了人们的注意。太二酸菜鱼的母公司九毛九集团的公关负责人对此进行了回应。他在接受媒体采访时说,他们正在对这件事进行调查,而且太...
日期:10-27
互联网找到了新春晚?_央视新闻网络春晚
声明:本文来自于微信公众号字母榜(ID:wujicaijing),作者:刘星志,授权转载发布。距离阿根廷世界杯夺冠已经过去数天,梅西夺冠相关词条仍旧挂在各大内容平台的热搜前列。虽然赛场上并...
日期:12-22
《黑神话:悟空》官方首度公开回应DLC、电影计划!一个确定、一个神秘
快科技9月23日消息,《黑神话:悟空》现已发售一个多月,众多玩家已经完成了游戏,满怀期待游戏科学能够放出《黑神话:悟空》DLC或其他方面的消息。而在9月21日举办的2024 北京文化论...
日期:09-24
毫末智行coo「毫末智行发布三款千元级产品 张凯:可实现行泊一体智驾」
【网易科技10月11日报道】今日,在第九届HAOMO AI DAY上,毫末智行董事长张凯在现场分享了对2023年智驾市场竞争局势的判断以及毫末四大战役的最新进展。中国联通靓号节在演讲中...
日期:10-12
人人网概念股票_人人网IPO让人想到互联网泡沫
  北京时间5月6消息,《福布斯》上海分社社长范鲁贤(Russell Flannery)今天发表文章,称人人网IPO首日股价大涨,让人想起了90年代的互联网狂潮:   中国社交媒体网站人人网周三...
日期:07-27
智汇云舟三维全景融合解决方案「智汇云舟精彩亮相WMDC2023元宇宙开发者大会」
11 月 22 日,由上海市经济和信息化委员会、上海市黄浦区人民政府指导,黄浦区科学技术委员会、黄浦科创集团、泰伯网联合主办的WMDC2023 首届元宇宙开发者大会在上海科学会堂开...
日期:11-23
相聚2024服贸会,“专精特新”迸发科技新力量_2021服贸会百度百科
通信世界网消息(CWW)作为中小企业的“领头羊”,“专精特新”企业专注于细分市场,创新能力强、市场占有率高、配套能力突出、掌握关键核心技术,是推进科技进步与经济增长的重要力...
日期:08-30
科技赋能服务 钱小乐成为“借钱三巨头”之一「钱小乐借款」
随着数字化、智能化时代的到来,网贷已成为一种越来越受欢迎的方便快捷的借款方式。在众多借款平台中, 360 借条、度小满和钱小乐成为了备受推崇的“借钱三巨头”。 360 借条依...
日期:05-12
消息称苹果CEO与COO热衷于今年推出AR/MR头显 但设计团队还想再等等「苹果公司ar」
3月13日消息,据外媒报道,每年都在推出新品的苹果,已多年未拓展他们的硬件产品线,现有硬件产品线已存在多年,但他们在准备新硬件产品的传言已有多年,传言最多的则是自动驾驶的电动...
日期:03-13
巴菲特2018十大持仓股_巴菲特巨亏3000亿 最新重仓股曝光
证券时报e公司讯,北京时间8月6日晚间,伯克希尔哈撒韦公司公布的二季度财报显示,因投资组合出现巨额帐面亏损,今年第二季度公司归属于股东的净亏损高达437.55亿美元(约合人民币295...
日期:08-08
超越iOS 2024年第一季度华为鸿蒙系统市场份额增至17%_华为将发布鸿蒙系统龙头股
【】CounterPoint的报告显示,2024年第一季度,华为鸿蒙系统在全球市场的份额从2%增长到4%,而在中国市场的份额则爆增至17%。同期,苹果iOS在中国智能手机操作系统市场的份额则下降...
日期:06-13
700MHz网络打底,山东移动为胜利油田构建“最强大脑”_胜利油田移动应用中心
通信世界网消息(CWW)在指挥中心的大屏幕上,远在数千米外的井站实时图像清晰可见;油井工况图每半个小时更新一次,系统据此判断生产是否正常;如果需要开井或者将采油废水注回,技术人...
日期:12-08
线上机会迎来爆发!MONO流量矿机加速与赋能2020
  尽管受到了疫情了影响,但是国内很多公司依然于2月3日起恢复了日常工作,尤其是 IT科技相关的。MONO流量矿机团队(摩尔数据)也不例外。   在开工信上,MONO流量矿机表...
日期:06-23