2017年7月

为什么R² = 0.99不一定是好消息?

原文作者:Gary Ernest Davis 

译文作者:我是崔小白,哆嗒数学网翻译组成员。

校对:333

 

 

微信、手机QQ搜索关注 哆嗒数学网 每获得更多数学趣文

新浪微博:http://weibo.com/duodaa

 

 

在经济、政治科学和心理学等社会科学领域中,人们普遍认为R = 0.7在线性回归的结果中是值得庆贺的。

 

 

R2 反映了因变量的全部变化能通过回归关系被自变量充分解释的比例,然而对于R = 0.7,这个比例大约是50%。

 

在物理学中,因变量和自变量需要更高的线性拟合度,所以在物理学期刊中,如果R2的值如果小于0.95则认为研究结果是十分不可靠的。

 

如果我们线性回归中的r2 =0.99说明总体结果良好,对吗?我们可以确定一定以及肯定,因为在因变量的变化中只有1%不能由自变量的变化来解释的。

 

其实那可不一定,可以用如下简单的例子来解释。

 

 

生物学的一个案例

支原体细菌有一个包含580076个核苷酸的基因组。在该基因组中,起始密码子ATG出现了9,020次,并且这些ATG密码子开始和结束的位置为214, 263, 355, 452, 467, 547, 568, 686, 734, 822, 831, 850, 930, 1023,  … , 579349, 579358, 579437, 579508, 579579, 579717, 579804, 579846, 579889, 579892, 579927, 579961, 580026, 580042。我们可能会问的一个问题是:这些ATG密码子的位置是否均匀分布在基因组上?

 

 

解决这个问题的一个非常简单的方法是,在1到580,076的范围内,产生9020个均匀分布的随机整数,并以这些随机整数为自变量绘制出ATG密码子位置的散点图。换句话说,通过线性回归,我们来看ATG位置的变化有多少是可以由均匀随机整数变量的变化来解释的。

 

(熟悉线性回归的读者可能会认为这并不是一个好主意,因为这里的自变量是服从均匀分布的,而不是正态分布——这是线性回归的基本假设之一。)

 

下面这幅图描绘的是ATG密码子的位置比照从小到大排列的9020个均匀分布随机整数的散点图:

 

 

数据点的位置––ATG比照有序的随机整数–是蓝色的线表示,而回归线由红色的线表示。

 

对于这个回归得到r2 = 0.9912,这表明ATG密码子位置的变化只有小于1%的比例不能由自变量,即这里的随机整数的变化所反映。

 

然而,这幅图还告诉了我们一些别的东西:数据点先是在回归线的上方,然后落到回归线以下,接着又回到了回归线上方。

 

更为仔细的观察

 

我们可以更清楚地了解数据点和回归线之间的差异–残差–通过观察残差图:

 

 

也许这只是一个从1到9020的特定随机选择的产物?

 

为了测试这个问题,我们可以多次重复我们的随机选择。当我们这样做的时候,发现这种模式仍然存在:在支原体基因组中,ATG密码子的位置和1至9020的有序随机整数之间存在很小但真实存在的差异。

 

基因组中的ATG密码子位置和随机位置是一个很小的但也可能很显著的差异。

 

作为一个生物学家,你不想深入研究一下吗?

 

得到的启示

警惕“高”的R2 值:仔细地观察回归中的残差图,并试图理解这个图背后的含义。

 

 

微信、手机QQ搜索关注 哆嗒数学网 每获得更多数学趣文

新浪微博:http://weibo.com/duodaa

开放存取式数学研究与论文创作

 

微信、手机QQ搜索关注 哆嗒数学网 每获得更多数学趣文

新浪微博:http://weibo.com/duodaa

 

 

 

作者:王浩,牛津大学教育学硕士,香港城市大学英语博士,现于香港浸会大学从事英语教学工作。

 

 

从牛顿在苹果树下被砸出灵感的传说可见,长期以来,科学研究都是以个体为单位的科学家以及由个体科学家所领导的团队所从事的工作。而近年来,互联网技术的兴起却有可能改变这一数百年所形成的传统,为科研合作提供新的范式与平台。笔者试图从一个英语写作老师和应用语言学研究者的视角,通过介绍数学家陶哲轩等人倡导的开放存取式(open access)数学研究项目Polymath,讨论互联网时代新型的科研合作模式在数学界的发展,并思考科学2.0与论文写作2.0在未来发展中面临的机遇与挑战。
 
 
1. 开放存取:数学家陶哲轩教授倡导和参与的数学科研新范式 
 
 
 
 
当代数学家、菲尔兹奖得主陶哲轩教授在2009年当选美国人文与科学院院士的演讲上介绍了近年来数学研究界出现的一种新型合作模式Polymath。他在演讲中指出,互联网是古腾堡印刷术以来对人类科研与交流影响最大的技术。通过利用互联网建立一个开放的数学研究平台,数学家和对数学感兴趣的人士可以针对某个数学问题的研究共同努力,获得比个体数学家或研究团队更有效的科研成果。陶教授还指出,自己曾将撰写的这篇演讲稿放在博客上收集网友的评论,并根据意见作出修改,这也体现了他的知行合一。 
 
   
 
 
          最早提出这种互联网开放存取式数学研究模式的Tim Gowers教授在其博文《群体合作数学是否可能?》(Is massively collaborative mathematics possible?)指出,这种群体合作模式有以下三个优势:
 
1)很多时候解决问题是需要运气的,仅从概率的角度来看,更多人的参与也会提升好运气的机会;
 
2)通过交流互动集思广益能让具有不同知识和背景的合作者碰撞出火花与洞见;
 
3)有的人善于提出新的想法,有的人更专注于对想法具体实现,合作有利于参与者取长补短共同进步。 
 
 
2. 专门用途英语视角下的开放式数学论文写作与修改 
 
 
 
 
2016年应用语言学界著名的学术期刊《专门用途英语》(English for Specific Purposes) 发表了英国Sheffield Hallam University大学教育学院英语老师Lisa McGrath博士的论文《开放存取式写作:针对一篇纯数学研究论文的在线初稿写作与修改的研究》(Open-access writing: An investigation into the online drafting and revision of a research article in pure mathematics)。这是应用语言学界和专门用途英语研究领域第一篇关注开放存取式数学论文写作的论文。
 
McGrath博士通过收集和分析Polymath 8博客下的659条评论(共计57,105词),利用前人工作总结出的框架,对相关评论进行编码后分作6大类:
 
1)数学论证(mathematical argument):相关的编码包括检查或修改现有的数字内容;设置数学符号;编写定义、定理和论证;
 
2)元数学论证(meta-mathematical argument):相关编码包括调整或建议添加说明文字、例子或者对选取研究方法动机的解释;讨论引用文献;在导论中讨论研究的语境与框架
 
3)说明性结构(expositional structure):相关编码包括论文分节、图表和图形的排位;信息呈现流程的控制
 
4)命题式展开(propositional development)产出新的数学知识;报告和讨论新的结果
 
5)格式讨论(formal):调整或报告句子层面的问题(如数学代码或文本的笔误)
 
6)运营讨论(operational):组织调配工作与合作;处理技术相关问题;分配工作量;报告作出的修改;讨论与出版相关的问题;选择期刊;决定作者身份   
 
分类 出现次数
数学论证 158
元数学论证 81
说明性结构 35
命题式展开 75
格式讨论 177
运营讨论 120
646
 
 
McGrath博士对开放式论文写作与修改过程的研究所使用的框架对于需要用英语写作数学论文的朋友也有一定的启发。从上表可见,数学论文的作者不仅要在数学论证上动心思,还要在所谓元数学论证上下功夫,也就是要对自己的工作本身进行思考和讨论,不仅让读者知道自己做了什么和如何做的,还要让读者明白自己为什么这么做。与此同时,在数学论文写作的格式与运营方面,多些和导师、同学讨论获取他们的帮助也很重要。
 
 
 
 
 
 
正如McGrath博士在论文中所说,由于本研究的数据主要来源于博客中的讨论,并没有触及具体论文不同版本的修改或写论文前Polymath参与者就数学问题本身的讨论。因此,Polymath这种新型数学研究模式所涉及的内容和对数学研究者的启发远远不止这篇论文讨论的范围。然而,McGrath博士作为第一位关注Polymath的英语老师和研究者所展示出的宽广的研究视野和具开拓性的研究精神却值得我们学习。  
 
3. 从科学2.0到论文写作2.0 
 
McGrath博士的论文可以放在科学2.0和论文写作2.0这两个较大的语境下解读,或许能为广大的科学研究者和从事论文写作的作者、老师提供新的启发。
 
 
 
2008年马里兰大学计算机系Ben Shneiderman教授在顶级期刊Science上发表短文Science 2.0具有前瞻性的指出互联网技术在为新一代的科研范式的产生和发展提供机遇的同时也需要 “新一代科学Science 2.0来研究社会科技系统中的综合性跨学科问题” 。作者认为,科学1.0时代的英雄像伽利略、牛顿和爱因斯坦提供了关键的方程来描述重力、电、磁和光之间的关系。相反的,Science2.0的领袖们研究重点在信任、同理心、责任与隐私。作者预言,未来400年的伟大科学探险将在于界定、量度和预测上述这些变量从而加速科学发现、工程创新、电子商务和教育。由此可见,新型的科研范式和合作模式也为科学界提出了新的课题和新的挑战,甚至会带来一场新的科学革命。
新的科学革命对英语论文写作与修改也提出新的挑战和机遇。笔者作为一名英语写作老师,也曾协助不少的博士生、青年教师修改英语论文。因此在这里,我想思考一下互联网时代新型科研合作与交流对英语论文写作可能产生的影响。
 
长期以来,论文的写作、审稿都是一个相对封闭的过程。为了确保公平、公正,大多数期刊都采用了双盲的审稿模式,即作者和审稿人都是匿名的。然而,这种模式也带来了不少问题,其中最显著的一点是审稿周期太长。笔者2016年在Journal of Second Language Writing上发表的一篇关于论文修改的文章从2015年6月底初次投稿到10月底获得审稿人的首次意见再到2016年3月最终见刊,前后耗时长达9个月,据说还是比较幸运和顺利的。
 
然而,学界在审稿方面的改革尝试并不成功。顶级学术期刊Nature曾于2006年推出开放式同行评阅的实验。研究人员向1369篇通过Nature编辑初审的论文稿作者发出邀请参加这次实验,仅有71篇的作者同意参与实验,将论文稿放在网上接受开放式评议。
 
 
 
开放式审稿遭到冷遇或许说明科学界对于在工作方式上的革新并不热衷,而在论文写作方面,想推行这方面的改革就更困难了。除了像Polymath这种没有特定作者的项目可以实现互联网上的开放式写作与修改,绝大多数的作者仍然只能在小范围内获得导师或朋友的帮助。然而,我们不难想象在互联网时代协作式论文写作对于提升写作效率、改进论文稿质量的潜力。如果作者能将自己的论文稿放在网络上如同维基百科或者开源软件的代码那样供大家讨论和修改,整个论文创作和修改的过程都会发生根本性的改变。  
 
4. 结语   
 
科学的发展,和人类文明的进步一样,是在传统与创新这两种力量的博弈与平衡间进行的。一方面,科学家必须不断利用传统的资源和制度来工作;另一方面,创新又是科学不断发展和进步的动力源泉。本文所讨论的开放存取式的数学研究与论文创作模式是互联网时代研究工作方式上的创新,和历史上各种创新一样,都会遇到很大的阻力和困难。陶哲轩教授曾在一次演讲中提到,当他提交署名为Polymath的论文给加州大学洛杉矶分校数学系时,工作人员拒绝接收这份论文作为他的成果。对于享誉世界的陶哲轩教授,这当然不足挂齿。但是对于众多还在为职称而劳碌、为三餐而奔波的大学青年教师来说,Polymath这类的开放式协作模式在贡献认可机制上的缺陷却是致命的。 爱因斯坦早就说过:科学是很棒的工作,只要不靠它谋生(Science is a wonderful thing if one does not have to earn one's living at it.)。笔者相信,随着科技的发展、人类文明的进步,我们会在不久的将来摆脱生存所带来的焦虑和个人名利的束缚,摸索出一套更能发挥个人和集体合作潜能的科研工作与论文写作模式。 
 
 
参考文献
 
Greaves, S., Scott, J., Clarke, M., Miller, L., Hannay, T., Thomas, A., & Campbell, P. (2006). Nature’s trial of open peer review. Nature, 444(971), 10-1038. 
 
McGrath, L. (2016). Open-access writing: An investigation into the online drafting and revision of a research article in pure mathematics. English for Specific Purposes, 43, 25–36.  
 
Shneiderman, B. (2008). Science 2.0. Science, 319(5868), 1349–1350.  
 
 
 

微信、手机QQ搜索关注 哆嗒数学网 每获得更多数学趣文

新浪微博:http://weibo.com/duodaa

2017国际奥数竞赛结果:韩国第一,中国第二

 

微信、手机QQ搜索关注 哆嗒数学网 每获得更多数学趣文

新浪微博:http://weibo.com/duodaa

 

 

根据国际数学奥林匹克竞赛(IMO)官网最新消息(http://www.imo-official.org/),在巴西举办2017年第58届国际数学奥林匹克竞赛成绩揭晓。韩国队以170分的成绩获得团体第一,中国对159分夺得第二,越南155分获得第三。此前连续两年夺得第一,此次比赛志在三连冠的美国队,仅获得第四名。第五到第十名依次是,伊朗、日本、泰国、新加坡、中国台湾、英国、俄罗斯。

 

 

此次是韩国是第二次获得国际数学奥林匹克竞赛团体第一。2014年当韩国举办世界数学家大会(四年一届的数学界最高规格会议)时,第2012年韩国夺得的IMO团体第一被作为韩国当代的数学教育成绩被做入大会举办方的宣传视频。

 

 

此前,我们哆嗒数学网的小编介绍过此次比赛的一道题目(见这里)。从结果来看,这道和游戏有关的题目成为了此次比赛的最难的一道题目。来自111个国家的615名参赛选手,只有来自6个国家的7名选手有得分。其中,完全作对的只有来自俄罗斯和奥地利的两名选手。

 

近年来,国内在为“奥数”降温的同时,似乎部分舆论又在走向另外一个打压“奥数”的极端。相反,其他国家对“奥数”开始重视,比如美国的启动的集训模式,以及韩国的国家理科班模式。

 

尽管没有夺得第一名,第二名也是一个非常优异的成绩,我们向中国队表示祝贺!

 

微信、手机QQ搜索关注 哆嗒数学网 每获得更多数学趣文

新浪微博:http://weibo.com/duodaa

奥数竞赛题目:召唤师峡谷中的追杀

 

 

微信、手机QQ搜索关注 哆嗒数学网 每获得更多数学趣文

新浪微博:http://weibo.com/duodaa

 

 

柔弱可怜的兔子提莫与攻击力爆棚的猎手艾希在一个无阻挡物件、大小无限的召唤师峡谷相遇了。艾希以为见到了软柿子,一定要击杀提莫!

但他们交手时发现,它们的技能不知道被谁修改了,再也不是《英雄联盟》游戏中的那些了。

提莫有一个强力的被动隐身技能,让艾希在任何时候无法看到他。还有一个更加恐怖的免疫任何伤害的技能,施放后10亿秒内免疫一切伤害。另外,还有一个逃跑技能,冷却时间1秒,作用是跑向离自己当前位置1米的地方。

艾希也不是吃素的,她有个大杀招可以把周围100米范围内的任何猎物秒杀,而且可以任意时间使用。还有一个用来搜索猎物位置的技能,但是这个技能不能给出猎物的准确位置,可能与猎物的实际位置有不超过1米的误差,即是说她只能探测出猎物存在的一个圆形范围,冷却时间1秒。当然,她有个追击技能,作用是自己向自己想要的方向追出一米,冷却时间是1秒。

假设,游戏时间可以无限,提莫和艾希现在处于相同位置,那么艾希是否有办法一定能击杀提莫?

 

 

好吧,如果我告诉你,上面的游戏描述的是2017年第58届国际数学奥林匹克竞赛(IMO)第3题的内容,你会惊讶吗?

但事实上就是如此。当然,IMO比赛会用非常严谨的数学语言表达,原题表述如下:

 

 

不知道参赛的同学们在考场上会不会想到自己在娱乐游戏中的场景。

按往年的经验,IMO竞赛的第3题和第6题会是最难的两道题目。我们这里不提供答案,实际上现在答案已经能从网上搜到。从网上提供的答案来看,提莫10亿秒的免疫时间还是太长了,兔子提莫完全有机会逃脱。

于是我们排开竞赛的因素,想问几个更加有趣的问题:

1、 把免疫时间减少到多少秒时,艾希能有办法一定能击杀提莫?
2、 把艾希大招范围增加到多大时,艾希能有办法一定能击杀提莫?
3、 考虑艾希搜索技能的概率因素,怎么样设置提莫免疫时间和艾希大招范围,使得游戏的平衡的?

另外,我们总希望把一些数学题目变好玩,可以从身边的题目玩起呀!

 

微信、手机QQ搜索关注 哆嗒数学网 每获得更多数学趣文

新浪微博:http://weibo.com/duodaa

天妒英才:世界首位女性菲尔兹奖得主逝世

微信、手机QQ搜索关注 哆嗒数学网 每获得更多数学趣文

新浪微博:http://weibo.com/duodaa

 

 

伊朗天才数学家,世界首位女性菲尔兹奖得主,玛利亚姆·米尔扎哈妮,因乳腺癌医治无效,于当地时间7月15日在其所在医院去世,享年40岁。

 

“世上的一盏明灯就此熄灭了,我的心都碎了……她走得太快了,”美国宇航局的伊朗裔科学家,Firouz Naderi,在他的Instagram(注:国外著名图片社交平台)上的最新消息中写到。后来他发推补充到:天才?没错。当然她还是一位女儿,一位母亲以及一位妻子。


米尔扎哈妮从2013年起,已与癌症斗争了四年,最近因癌症已经扩散到骨髓而住院。


米尔扎哈妮1977年出生于伊朗德黑兰,儿时的梦想是成为一名作家。后来在其哥哥的激发下进入了数学学习。她为代数几何做出了开创性贡献,于2014年获得菲尔兹奖。


米尔扎哈妮于1994年和1995年两次获得国际数学奥林匹克竞赛(IMO)金牌,于1999年获伊朗谢里夫理工大学数学学士学位并于2004年获哈佛大学数学博士学位。


在2004至2008年间,她是普林斯顿大学克雷数学研究所的研究员和助理教授。后来她在斯坦福大学担任教授。她获得的荣誉包括2009年因在纯数学领域研究中所做的贡献而获得的布卢门撒尔奖,以及2013年美国数学学会颁发的萨特数学奖。2013年获得萨特的获奖感言中,米尔扎哈妮隆重感谢的自己在伊朗接受教育的两所学校的老师——德黑兰Farzanegan女子高中(为女子天才设立的专门学校)以及谢里夫大学——称赞他们是“伟大的教师们”。

 


米尔扎哈妮是世界上获得被称为数学最高荣誉菲尔兹奖的第一位女性(也是目前唯一一位女性),也是第一个获得此奖伊朗人。当2014年米尔扎哈妮的获奖消息传回伊朗,伊朗舆论当时有截然相反的态度。当时伊朗总统哈桑·鲁哈尼在推文上发出了米尔扎哈尼没有带头巾的照片。回帖立刻分为两派,强硬派对此照片强烈抗议并拒绝对米尔扎哈尼获得的成就表示祝贺,而另外一派认为鲁哈尼此行为具有进步意义并点赞。伊朗国内还有人向国家施压,认为应该按照伊朗的伊斯兰刑法典处罚米尔扎哈妮。

 

微信、手机QQ搜索关注 哆嗒数学网 每获得更多数学趣文

新浪微博:http://weibo.com/duodaa

将咖啡转化成定理的男人

微信、手机QQ搜索关注 哆嗒数学网 每获得更多数学趣文

新浪微博:http://weibo.com/duodaa

 

 

数学家过生日你要给他送什么呢?嗯,如果是一个大生日,比如100大寿,你可以举办一个以他命名的会议为他庆生。前几天就发生了这样一件事:数学家们聚集到了匈牙利,庆祝保罗·埃尔德什(Paul Erdos)诞辰100周年。


会议期间,他们讨论了埃尔德什的工作和他留下的宝贵遗产。不论埃尔德什的数学能力还是他的工作风格都使他成为了一个传奇人物。下面让我们看看他是如何影响数学这一学科的:

 


他是一个“问题解决者”


一般来讲,数学家分两种:一种是“解决问题者(Problem Solver)”,一种是“理论建立者(Theory Developer)”。人们首先听说的通常是解决问题的那类数学家,他们常常出现在新闻中。但是关注度最高的数学研究往往是关于高深理论的。就像在物理里,不论是资金还是关注点,通常都和大一统理论相关。

 

埃尔德什对解决问题更感兴趣。处理“疑难杂症”是他的强项。他会去攻克数学中各个领域的难题,并且他不介意用什么工具去解决:比如他就很擅长用高中知识去解决一些艰深问题。 他用行动证明了数学中并不是所有东西都能被宏大理论所囊括。

 


他发表了很多论文


埃尔德什四处狩猎有意思的问题,这使它的足迹遍布了整个世界。他是数学界的牧羊人,不带支票,不带信用卡, 拎着装了半箱的手提箱走遍了世界。“财产就是累赘”——他如是说。


他经常会出现在同事的家中,以咖啡和苯丙胺(译者注:一种兴奋剂)为燃料轰击谜题。他不断旅行造就了他惊人的产出:埃尔德什一生发表了1525篇论文,历史上只有欧拉比他发表的论文多。


尽管数学常常是独行侠的天下,但埃尔德什却将它视为社交工具。最近兴起的polymath项目其实就是埃尔德什哲学的成功推广。
(译者注:Polymath项目由英国数学家蒂莫西·高尔斯[Timothy Gowers]发起。在该项目中,多个数学家协作交流,合力解决数学问题。目前为止,已有多个艰深并且重要的问题在polymath中被解决。)

 


他的人际圈很广


由于他大量合作并发表论文,埃尔德什最终有了500多个共同作者。他的数学家小伙伴们发明了“埃尔德什数”来衡量一个人与埃尔德什的“连接程度”。如果你与埃尔德什一起发表过论文,那么你的埃尔德什数是1。如果你没和埃尔德什发表过论文,但与一个和埃尔德什合作过的人发表过论文,那么你的埃尔德什数就是2,以此类推。这其实就是数学版的“贝肯六度空间理论”。(译者注:凯文·贝肯 [Kevin Bacon] 是美国著名演员。电影爱好者间曾流行找到任何一个演员到凯文·贝肯的最短路径。)


如果把你的贝肯数和埃尔德什数相加,得到的就是埃尔德什-贝肯数。比如费曼的埃尔德什-贝肯数是6,娜塔莉·波特曼(Natalie Portma)的埃尔德什-贝肯数是7。
 
 

 


埃尔德什除了有着复杂的合作网络,他还发明了一种生成随机网络的方法。以他和匈牙利数学家阿尔弗雷德·伦伊(Alfred Renyi)命名的埃尔德什-伦伊(Erdos-Renyi)模型是首个生成随机图的算法。该模型中,我们选定若干节点,然后以相同的概率在任意两点之间连线。由于它数学上的简洁性,埃尔德什-伦伊模型至今还被广泛应用在传染病模型以及金融系统稳定性研究中。

 

 

他喜欢素数


尽管埃尔德什喜欢探索数学的各个领域,他对素数尤其感兴趣。20世纪40年代末,埃尔德什开始研究素数定理。素数定理说的是假如你有一个非常大的数x,那么差不多存在x/log(x)个素数小于x。此前素数定理的证明冗长而繁琐。埃尔德什与挪威数学家阿特勒·塞尔伯格(Atle Selberg)找到了一个非常简洁的证明。然而即使是埃尔德什也并不总是能解决他感兴趣的问题。比如他曾苦苦思索孪生素数猜想,但他只证明了一个很弱的结论。事实上,直到最近张益唐的工作才使孪生素数猜想有了突破性的进展。

 

 

 

 

他为解决难题提供奖金


为了鼓励人们去解决难题,埃尔德什会为一些问题设立奖金。对于他认为比较简单的问题,他会设立10到25美元不等,对于他认为很难的问题,他则会设立上千美元作为奖金。一个数学家想通过这种方式挣钱并不简单,如果埃尔德什不喜欢某个证明,他还会克扣奖金。

 


他没有获得数学界的最高荣誉


一般认为数学界的最高荣誉是菲尔茨奖,但埃尔德什并没有获得过这个最高荣誉。塞尔伯格与埃尔德什发现素数定理的简洁证明后,他迅速就这个证明方法写了一篇论文。这也成为了塞尔伯格获菲尔茨奖一大助力。然而这并不是埃尔德什喜闻乐见的(译者注:塞尔伯格和埃尔德什曾就是否该联合发表素数定理的论文争得不可开交)。在与塞尔伯格的争吵过后,埃尔德什再一次提起了他的行囊,去寻找更多有意思的难题。沿着他的足迹我们可以发现一连串新奇的问题和方法。 伦伊曾经说过“一个数学家就是一台将咖啡转化为定理的机器”。在这一点上,没有人像埃尔德什做得这么好。

 

译者注:


1.一般外界认为数学界的最高荣誉是菲尔茨奖(Fields Medal),但由于菲尔茨奖仅颁给年龄小于40岁的数学家,它并非终身成就奖。与之相比,沃尔夫奖(Wolf prize)与阿贝尔奖(Abel prize)则更能说明问题。埃尔德什获得过沃尔夫奖。塞尔伯格则是菲尔茨奖、沃尔夫奖以及阿贝尔奖的大满贯得主。


2. 埃尔德什不仅在数学上造诣极高,他的生活方式也很令人感动。更多关于埃尔德什的故事请见:http://www.brunel.ac.uk/~csstzzw/Erdos.html


3. 埃尔德什与塞尔伯格对素数定理证明中两人各占多少功劳存在分歧,在发表论文时,两人就闹翻了。这段有意思的故事可以参考:Goldfeld, Dorian. "The elementary proof of the prime number theorem: An historical perspective." Number Theory. Springer New York, 2004. 179-192 (英文).

 

微信、手机QQ搜索关注 哆嗒数学网 每获得更多数学趣文

新浪微博:http://weibo.com/duodaa

来自未来的围棋:假如围棋棋盘有无限大

 

微信、手机QQ搜索关注 哆嗒数学网 每获得更多数学趣文

新浪微博:http://weibo.com/duodaa

 

 

AlphaGo和世界排名第一的中国棋手柯洁的比赛结束了。不出所料,即便柯洁这样的围棋大师,也已经完全不是我们人类发明的围棋程序的对手。但是,熟悉人工智能的人都知道,无论人工智能有多么强大,他能做出能让现在的人们多么惊奇的事情,它的本质并不是黑魔法,而仅仅是数学。

数学里有一个分支叫做博弈论,英语叫做Game Theory,直译过来就是“游戏理论”的意思。围棋是一种游戏,这个游戏的很多理论也符合博弈论的一些经典结论。博弈论里有一种游戏叫做完全信息博弈,意思是无论是自己还是你的对手,和游戏有关的所有信息都是知道的。自己能走哪里,对手能走哪里,自己之前做过什么,对手之前做过什么,都是相互知晓,没有隐藏。相反,现在最火的电脑网络游戏之一的《英雄联盟》则不是完全信息博弈,因为迷雾的影响,你在某个时刻并不知道对手是在打野还是回城升级装备。

我们的故事现在开始。

用一种数学表示围棋

 

诗人歌德曾经调侃:数学家就像法国人一样,无论你说什么,他们都能把它翻译成自己语言,然后完全不是你刚才说的那样。我不知道这是在膜还是在黑,我保证读完这一小节后,有很多读者都会有这样的感觉。

当执黑先行,棋盘上有19×19=361个交叉点,加上Pass(即是说不走,让对方走),黑棋有362种下法可以选择,当黑棋下完第一步,那么因为之前黑棋下过的位置不能再下,白棋还剩360个位置可以行棋。当棋局进行到某个局面,考虑到按围棋规则不能落子的点,黑棋和白棋能下位置数量会有所不同,但可选择的下法有仅仅是有限个——不超过362个。

我们把每个局面下起手可以选择下法编号,0号下法是Pass,1号下法、2号下法、……n号下法。那么不嫌麻烦,我们下棋的时候,完全可以不用摆子,叫出下法编号就可以。

比如黑棋叫出1号下法,白棋叫出8号下法,然后黑棋再叫出下完1号、8号下法局面下的5号下法,再来给白棋叫出他的下法。实际上,这个时候,黑白双方已经不是在玩一个落子的游戏,而是在玩一个叫号的游戏,叫出的都是自然数。

黑方叫号:  1   5  8  9         11   12

白方叫号:   8  3   6  11         55   4

 

围棋会在有限步后终止游戏,判定胜负。终止的那一刻,我们记录下了一个序列,比如上面对局的序列就是<1,8,5,3,8,,12,4>,这是一个记录比赛进程的行棋序列,我们把这个序列一个符号x表示,特别的上面行棋序列的x(0)=1,x(1)=8,x(2)=5用它也可以来判定胜负。

 

按中国规则,黑棋要要还三又四分之三字给白棋。
我们制造一个集合 A = { x : x为行棋序列,x使得 黑棋子数-3.75 大于 白棋子数+3.75 }, 那么黑棋赢的表述就成了,行棋序列x∈A 。白棋赢的表述就是 x ∉ A 。

我们可以改变集合A,从而改变游戏的规则。比如比较温和的改动是改变还子个数,比如以前的围棋是不还子的。激进的改动是,如果行棋序列中使得围棋棋盘上首先出现五连珠的一方算赢,那么这游戏变成了一个可以吃子的五子棋,而不再是围棋。

但无论怎么改变集合A,有一点始终没变,游戏始终是一个完全信息的有限游戏(就是说每次能选择下法有限,游戏也会在有限步内终止)。


博弈论经典结论:完全信息的有限游戏,必有一方有必胜策略。意思是说,围棋在双方都有能力最强招的情况下,其实胜负已定。这种有一方有必胜策略的游戏,叫做决定的游戏

 


穿越到未来的围棋

 

好吧,如果一个职业棋手对我说,“你说胜负已定,你说是黑棋赢还是白棋赢?我们来下下?”,我只能报以微笑,并认输回应,虽然最强招在数学上被证明存在,存在性并不能保证我能知道它具体是什么。就算棋力远远超过人类AlphaGo现在他也不能保证他知晓这个其实已经存在最强招法。

然而,我们可以试想一下,到某个遥远的未来。人类的智能水平发展到一个让现在的看来人匪夷所思的高度。每个人都知道围棋的最强招法,于是围棋变得无趣,因为还没有落子我们就知道了结果。

未来的人不再满足只有361个交叉点,他们设计横竖都无穷个行列(确切的讲是可数无穷),以满足每一次轮到他落子的时候,自己可以有无穷个可以落子位置。他们也不再满足在有限步结束的游戏,而把游戏规定成需要无限的进行下去。

他们还是叫号地玩游戏。这样,黑棋第一步,在0号下法,1号下法,..., n号下法,…选择出一种下法落子,然后白棋在对应局面的,0号下法,1号下法,..., n号下法,… 中选择一种应对。

棋局的出牌会变成这样:

 

方叫号 1      3       6       81        4       

方叫号    3       6      33       45       99   

 

这样,行棋序列会变得无限长,成为<1,3,3,6,6,33,81,45,4,99,>

 

这是一个在有限步之内无法完成的游戏。在当前的现实中,是无法完成这个游戏的。但是在数学中,无限是一个可以达到完成的实体。也许智能高度发达在未来,我们能在大脑的意念中,玩耍这个游戏。

那么如何判定输赢呢?和前面一样,事先设定一个集合A,A由一些无限长的自然数序列组成,如果最后得双方的行棋序列x是A里的元素,则黑棋赢。否则,x ∉ A 白棋赢。


新的游戏,似乎只是把有限的情况改成无限。它仍然的完全信息的游戏。那么无论我们怎么改变A,是不是黑白双方,必有赢的策略呢。

现在,我可以告诉你,之前的都是铺垫,真正的内容才刚刚开始。

 

这是什么游戏?

 

这不是小编杜撰的游戏,数学家,尤其是集合论学家们早已经研究了很多。这个游戏带来的相关论题,却和公理体系和实数结构有关系。

为了标记方便,我们把前面无限游戏下选定集合A为胜负判定集合的游戏叫做Game(A)。

为了阐述和实数的联系我们先做一个铺垫。如果你有拓扑学的基础知识的话,会很容易看懂下面再说什么。

取集合NS = { x: x为自然数的无穷序列}

对于两个自然数的无穷序列:

x = <x(0), x(1), x(2), …, x(n), …>∈NS

y = <y(0), y(1), y(2), …, y(n), …>∈NS

定义距离d( x, y) 如下:

 

 

你还能验证距离函数d( x,y )在NS中还是一个完备的距离。而这个距离诱导的拓扑竟然和无理数同胚(你试试用连分数验证一下)——虽然我们知道无理数在通常的距离下,无理数并不是完备距离空间——而无理数在很多数学意义下,占有了实数的大多数。研究NS这个自然无穷序列的空间就和实数的研究联系起来了(实际上,集合论学家更关心的是Borel同构,实数和无理数是Borel同构的)。

实际上,如你可以想到的,集合论里,把一个自然数的无穷序列称为实数。实际上,集合论学家把他看成实数的一种形态。下面的部分,当我们说到实数的时候将不区分这样的具体形态。

是不是我们无论怎样改变集合A, Game(A)的黑棋和白棋中都有一方有必胜的策略呢?

在现行使用最多,也最被人接受的数学公理体系ZFC中,你是可以用选择公理构造一个集合,使得黑白双方都没有必胜策略。

有很多办法,从不同角度去构造这样的集合。但我们不会在这里去表述这种集合的构造细节。这里只是提示一下其中的一个办法:无论黑棋的策略或者白棋的策略,都只有连续统基数c那么多个,而实数的子集实在是比这个多得多。用这个实数,超限的归纳和用一些对角线方法,就能造出这样的集合。

有一个集合A,使得游戏Game(A)的对局双方都没有必胜策略。但是,只要有人愿意开一把,行棋的序列总能判定胜负——这样的游戏是不是变得好玩了呢。


一些人的吐槽:选择公理是真的吗?

 

“什么?居然有一个集合A,让Game(A)不能被确定,我完全不能接受!”好吧,熟悉选择公理的人一定会说,选择公理做出来的东西不具有构造性,那意味着样的集合是看不清也摸不着的。的确,有的人更愿意相信所有的Game(A)应该有一方有必胜的策略,有就是说,游戏是决定的,这就是决定性公理。

决定性公理(Axiom of Determinacy,简称AD):对所有NS中的子集,所有的Game(A)都是决定的。

按照一般的要求,一个命题要成为公理,它应该至少要和常用的策梅洛-弗兰克尔公理体系(ZF公理体系)不矛盾,集合论中叫做协调。但是,这里有个很奇怪的结论,因为AD能推出ZF体系是协调的,于是根据哥德尔的第二不完备定理,ZF + AD这个体系是否相对于ZF协调,不能被证明。

另外,虽然ZF+AD中对普遍的选择公理(即任意多的集合簇有选择函数)不成立了,但是它对选择公理的的否定没有完全彻底,对可数选择公理还是成立的——ZF+AD能将可数个集合有选择函数变成定理(Countable Choice)。

于是,实分析中一些常用的定理,在ZF+AD还是成立的(至少在实数范围内是成立的),比如

可数个可数实数子集的并还是可数的。

海涅归结原理:当x→a时,实函数f(x)→b,当且仅当,对任意序列x(n)→a,n→∞,f(x(n))→b。

贝尔纲定理:实数这个完备度量空间中,可数个稠密开集的交稠密。

历史上,波莱尔曾经旗帜鲜明地反对选择公理,但他认为可数的选择公理是可以的,并且可数选择公理就够了。也许决定性公理可以成为他的一个选项。

        实际上,决定性公理会牵涉到实数的一些底层性质。而这些联系,是通过设计一些新的游戏来展示的。

 


        新游戏一:关于第一纲集和贝尔性质

 

     如果一个集合的闭包没有内点,那么这样的集合被称为无处稠密集合。而第一纲集就是可数个无处稠密集合的并。

     一个集合如果它和某个波莱尔集的对称差是第一纲集,我们说具有贝尔性质。

     我们现在来看一个新的游戏。在之前的Game(A)中,黑白双方叫出的是一个数字,而这个新游戏中,黑白双方叫出是一串数字,一个有限长度的自然数序列。

黑方叫号: <0,3,5,6>   <2,1>    <8, 9,7,9,5,9>  <4,12,5,7,8,0> ...

白方叫号:     <0,5>   <2,1,34,5>        <9>     <4,12,5,7,8,0>  ...

 

  同样,我们把这些序列拼接起来,能得到一个无限长的自然数列,比如上面的拼接起来就是 <0,3,5,6,0,5,2,1,2,134,5,8, 9,7,9,5,9,9,4,12,5,7,8,0,4,12,5,7,8,0, ...>

 

我们还是设定一个集合A,规定得到的序列x∈A,黑方赢,否定白方赢。

这个游戏叫做Banach-Mazur游戏,在设定的集合A下,我们把它名字叫做Game1(A)。

如果你理解了前面的编号思想,你很容易想清楚,如果所有的Game(A)是决定的,那么所有的Game1(A)也是决定的。

你可以试试证明这样一个事情:Game1(A)中,白方有必胜策略,当且仅当,A是第一纲集。

于是,有人能利用上面的结果,得到:

如果决定性公理成立,则任何实数子集都具有贝尔性质。

因为,贝尔性质是一种拓扑性质,所有决定性公理其实能说明实数在拓扑性质上的一些确定性。

 


新游戏二: 完备集性质和连续统假设

 

如果一个实数子集是没有孤立点的闭集,我们说这个集合是完备集。如果一个实数子集是有限的或可数,再或包含一个完备集,那么我们说这个集合具有完备集性质。

我们新游戏二的规则发生重大改变。黑方能叫的号还是一串数字,不过数字只能在0和1中选择,而白方只能叫出一个数字,同样只能在0,1中选择。

黑方叫号: <0,1,1,0>   <0,1>   <0, 1,1,1,1,1>  <0,0,1,1,0,0>    ...

白方叫号:       0      0           1          0      ...

 

同样,我们把这些序列拼接起来,能得到一个无限长的0-1列,比如上面的拼接起来就是,<0,1,1,0,0,0,1,0,0, 1,1,1,1,1,1,0,0,1,1,0,0,0,...>

这里,我们其实已经只是在0-1序列组成的空间里叫号了。

取集合TS = { x: x为0-1无穷序列},

x = <x(0), x(1), x(2), …, x(n), …>∈TS

y = <y(0), y(1), y(2), …, y(n), …>∈TS


这个TS空间里,如果我们按前面相同的方式定义距离

 

 

那么通过这个距离诱导得到的拓扑空间,和康托集同胚。

我们设定一个TS的子集A,规定得到的序列x∈A,黑方赢,否定白方赢。定名Game2(A)。

同样,用一些小技巧,我们可以知道,在决定性公理成立的情况下,所有的Game2(A)都是决定的。

关于这个游戏,有两个经典的结论。
Game2(A)中,白方有必胜策略,当且  仅当,A是可数或者有限集合。

Game2(A)中,黑方有必胜策略,当且仅当,A是包含一个完备集合。

于是,如果决定性公理成立,那么任何实数子集都有完备集性质。

如果,你对完备集合一些性质比较熟悉的话,会知道完备集合的是和实数集合等势的。于是,我们在决定性公理成立的情况下,得到一个比较弱的连续统假设成立:任何一个实数子集要么和实数等势,要么至多可数的势。

 


新游戏三:勒贝格测度与可测集合

 

这里,由于篇幅原因,我们不再具体介绍新游戏三了。新游戏三的大致思路就是,想办法把游戏移植到传统形态的实数上去,并把勒贝格测度结合起来。通过前面两个变种游戏,大家应该能相信,这样事情是能办到的了吧。

这里要说的重点是下面这个有意思结论。

如果决定性公理成立,所以实数子集都是勒贝格可测的。于是什么不可测的Vatali集,Banach分球怪论什么的,都不存在了。

 

结束

 

我们从一个传统的围棋游戏开始讲述,把围棋用数学转化成了一个大家只呼喊自然数的游戏,然后进一步让它“进化”成了一个无穷游戏。然后发现它居然能与实数的结构有着深刻的联系,难怪有集合论学家自嘲:

 

集合论学家就是一群不知道实数是什么的数学家。

 

微信、手机QQ搜索关注 哆嗒数学网 每获得更多数学趣文

新浪微博:http://weibo.com/duodaa