数学界到底是如何确认公理的?

Sky小仁

确立一套规范的公理体系,并以此为基础进行演绎推理,是数学,尤其是现代数学的核心研究方法。任何一个成熟的数学理论和数学概念,第一步都是要确立它所满足的公理体系。这一方法是由古希腊人开创的,欧几里得在他的《几何原本》中提出了几何学研究的五条公设作为推理的前提,在此基础上推导出了一系列复杂的数学结论。随后这一公理化研究的方法便成为西方科学发展的核心方法之一,发挥出巨大的威力,甚至影响到了其他学科的发展。例如17世纪唯理论哲学家斯宾诺莎的代表作《伦理学》,就是采用了几何学中先提公设再做推理最后得结论的研究方法来研究哲学问题,而20世纪初期罗素等人所开创的分析哲学,也是想把数学方法引入到哲学分析当中。

而在现代数学的研究中,数学分支日渐庞杂,理论高度抽象,层次不断深入,公理化方法甚至成为了数学研究的唯一方法。数学研究的路径逐步确立为:对现实世界或抽象形式进行观察与总结,对已有的数学概念进行本质分析,进而抽取出一套公理体系,并在此体系下进行逻辑推演从而发展出一整套数学理论。尤其是抽象代数这一门学科的诞生,将这种方法发挥到极致,其他诸如拓扑学,分析学等等,也都是采用的这样一套方法。

那么数学家们又是如何确立公理的呢?按照层次的不同主要分为两种途径。一是针对一些最基础的数学概念,如点线面,集合,自然数等等,我们是将一些所谓的“不证自明”的结论作为公理,这种方法主要集中在数理逻辑领域。二是针对抽象层次很高的数学概念,我们是来寻找一些已有的,具有共同特征的多个数学概念,总结出它们的共同特征,将此作为一套公理体系。下面就这两种途径我来详细地进行说明。

第一种途径比较容易理解,在数学发展的早期都采用的是这种途径。即有一些结论非常的显然和直观,很符合我们的感觉,我们可以利用这些结论来推导出其他结论,但是这些结论本身又很难证明,我们便将它们作为公理,例如几何学的肇始《几何原本》中的几条公理(或公设):两个直角彼此相等,两个量如果相等那他们加上同一个量仍然相等,都属于这种情况。再比如对于自然数这个概念,我们目前采用的是皮亚诺公理系统,这一系统中的一些公理如下,任何一个自然数加1(严格的数学概念称为为自然数的后继数"successor")还是自然数,两个自然数加一相等那这两个自然数也是相等的。再比如集合这个概念,我们采用的是ZFC公理系统,这一系统的一些公理如下,两个集合,如果含有的元素相同那这两个集合是相等的,两个集合的公共部分仍然是一个集合,等等。

当然,满足“非常显然和直观,但又很难证明”这样的结论有很多,那我们从中选取哪些作为公理呢?这主要是参照两个标准,一是对某个数学概念的公理体系的界定必须能清晰的说明这个数学概念的本质,不能产生歧义,更不能产生矛盾。比如自然数这个概念,它的本质就是一个一个往下列,因此我们的公理体系中会有一个自然数的后继者仍然是自然数这样一条。第二个标准就是所谓的三性:独立性,相容性与完备性,这是数理逻辑研究的领域,本文不再详细展开,大意是指公理与公理之间不能出现重复和矛盾,并且涉及该数学概念的所有真命题都可以从几条公理中找到答案。

按照这种途径确立的公理体系最著名的例子就是我们上大学都会学到的概率论。在20世纪以前,概率论的研究基本停留在用排列组合进行数数的阶段,即所谓的古典概率时期。而真正意义上的现代概率论,是从苏联数学家柯尔莫哥洛夫(Kolmogorov,1903-1987)开始的,他利用集合论和测度论的工具,确立了概率论研究的几条公理,开创了公理概率论这门学科,为了阅读的方便,本文不打算引入数学符号,只用直白的语言来叙述这几条公理:

1、任何一个事件发生的概率一定介于0和1之间

2、如果一个事件包含了所有可能的结果,那么他发生的概率一定是1

3、两个事件如果没有交集,那么他们发生的概率就是二者相加。(想象一下一个球队去踢球,赢球的概率是0.5,平局的概率是0.3,输球的概率是0.2,那么这场比赛不输球的概率就是0.5+0.3)

柯尔莫哥洛夫,苏联最伟大的数学家

可以看到,这三条公理非常清晰且自然地说明了“概率”这一现象的本质,我们目前接触到的概率论的所有结论,都是从这三条公理中及其相关概念中推导出来的。

用这一途径确定公理最大的缺陷就是所谓的“不证自明”,一个结论如何是显而易见并且不需要证明呢?显而易见只是每个人的自己的主观感受,又如何做到对同一个事情每个人的感受都一样呢。正因如此,这样确定的公理在历史上引起了巨大的争议,大名鼎鼎的非欧几何,就是数学家们认为《几何原本》中第五条公设不是那么显然,甚至不一定是正确的,进而发展出的一整套和理论。同时在集合论的公理中,选择公理也是这种情况。

而第二种途径确立的公理相比于第一种就可靠得多。即,我们已经有了一些数学概念,这些数学概念之间有几个共同的特征,我们把这几条共同的特征总结出来,就把它们作为一套公理系统。最著名的例子就是“群论”这一数学理论。比如我们有如下的数学概念:

1、所有的整数构成一个集合,整数之间存在一个运算叫做加法,这个加法运算有以下性质:满足结合律;有一个整数是0,任何整数加上0还等于自己;任何一个整数加上自己的相反数就等于这个零。

2、所有的实数构成一个集合,实数之间存在一个运算叫做乘法,这个乘法运算满足以下性质:满足结合律;有一个实数是1,任何实数乘以1还等于自己;任何一个实数乘以自己的倒数都等于这个1

3、所有的向量构成一个集合,上面存在一个运算叫做加法,这个运算满足以下性质:满足结合律;向量之间存在一个运算叫加法;有一个向量是零向量,任何向量加上零向量还等于自己;任何一个向量加上和自己相反的向量就等于这个零向量。

伽罗华, (Galois,1811-1832),群论的奠基人

上面是三个不同的数学概念,但是它们之间又具有相同的特征,我们把这个相同的特征提取来。有一个集合,它上面存在一个运算,满足三条性质:

1、这个运算满足结合律

2、集合中存在一个元素,使得集合中任何一个元素与该元素做运算都还等于自己,这个元素称之为幺元

3、对于集合中的任何一个元素,都存在与之对应的另一个元素,使得二者做运算的结果是幺元。

我们把这三条性质提取出来之后,为了研究的方便,给他们一个新的名字,称为群。于是上面三条结论就是群论的三条公理,所有有关群论的理论都是从这三条公理出发的。

这个例子就很好的说明了现代数学中公理是怎么产生的,因为现代数学研究的对象越来越复杂,很多概念混杂在一起便很难研究,很多性质交错在一起乱成一团,因此我们把一些具有共同特征的数学概念放在一起,提取出这一共同特征,便构成了新的数学概念,这些共同特征就是新概念的公理体系。这样做就使得我们的研究变得简洁并且清晰,在明确的公理体系之下推导出的结论,同样也适用于那些原有的概念,进而我们对那些原有概念的认识也会提升到一个新的高度,对它们的本质的认识就更加深刻。因此公理化方法就成了现代数学研究的核心方法


数学救火队长

(文/方弦)

很多人,包括很多搞数学的人,都说数学的基础是公理。平面几何的基础是欧几里德的公理,定义自然数的是皮亚诺的五条公理,而现代数学的基础则是策梅洛-弗兰克公理体系加上选择公理,起码很多人是这样说的。

但这种说法对么?

打个比方,要建一幢大楼,先要由设计师绘画这幢大楼的设计图,注明每一根柱子每一个窗户的大小位置和材料,然后由建筑工人一梁一柱慢慢建立起来,最后由装修工人完成装修。当大楼建好之后,我们能说大楼的基础就是设计图吗?

对,也不对。的确,没有设计图建不起大楼,但要建一座教学楼,很多设计图其实都能用。设计图告诉我们楼应该怎么建,但我们是根据要建什么楼来选择设计图,而不是随便抓一张设计图,就说我们需要的就是这幢楼。

数学也是如此。

我们建立公理体系,不是因为某个公理天然就是对的,而是因为我们需要用公理去刻画某些东西。我们要研究自然数,我们觉得自然数应该拥有某些性质,所以我们将这些性质以逻辑的语言化为一个个命题,从中抽取那些我们认为刻画了最本质特点的那些命题,将它们作为公理。

先有我们要研究的东西,再有公理。而不是先有公理,再研究它的延伸。没有天然正确的公理,只有适合研究某个东西的公理。毕竟,我们研究数学,是研究抽象结构之间的关系,这些结构很多都从实际生活中抽象而来,或者是因应数学研究的需要而发展出来。我们研究的是这些结构本身,而公理只是我们刻画这些结构的一种手段。如果反过来,认为公理才是对的,这反而是倒果为因,被单一的系统蒙蔽了双眼。

是的,数学可以有很多种。公理只是我们刻画数学结构的方法,理解了这一点之后,你看到的数学世界会变得更宽广。不同的公理体系可以存在,只是它们刻画的东西不一定相同。同一个东西,可以用不同的公理体系来刻画。要推广某个数学概念,只要稍稍放松刻画它的公理体系,就可以了。公理体系并不是什么不可动摇的基础,而是我们编织数学诗篇时写下的提纲,根据这个提纲,故事会根据逻辑自行发展,最终通过人的逻辑思维,导出公理体系指向的图景。

公理体系并非不可动摇,所以我们当然可以选择采用什么公理体系。对于数学家来说,只要公理体系足以刻画他们研究的数学对象,那就足够了,采用哪一个其实无所谓。我们说平面几何就是欧几里德的公理,其实把一些公理换成等价的命题也未尝不可,只是因为我们习惯了欧几里德的提法。我们说定义自然数的是皮亚诺公理,同样因为是皮亚诺第一个正确用公理刻画了自然数,那就这样用了。至于现代数学的基础为什么选取了策梅洛-弗兰克公理体系加上选择公理,纯粹是因为这套公理足以让大部分数学家能完成他们的工作,能在这套公理内表达他们研究的数学,所以就这样了。

这就是数学研究的运作方式。选择公理的历史很好地说明了这一点。一开始,巴拿赫和塔斯基证明了,如果承认选择公理的话,就可以将一个球切成几块非常奇怪的形状(实际上是一堆很勉强才说得上连起来的点),然后重新拼合,得到两个跟原来一模一样的球。这又叫巴拿赫-塔斯基分球定理。但后来人们发现,如果不承认选择公理,得到的结论会更奇怪,比如一个空间可以有两个维度之类的,而且有很多之前的数学,不承认选择公理的话根本表达不出来。所以人们还是接受了选择公理。至于分球定理,实际上因为切成的形状太奇怪,根本不能定义它的容积,所以现代数学家并不认为这是什么大问题。

你可能会觉得,选择公理既然引起过这么大的争议,它一定是个很复杂很麻烦的公理吧?但其实它非常简单,无非就是说,一堆非空集合,必定可以各自选出一个凑在一起,组成一个集合。仅此而已。但即使是这样“明显”的公理,数学家也要争论一番,正是因为他们一开始不清楚,自己所做的数学是否被这个公理刻画。

再说现代数学的基础。实际上除了策梅洛-弗兰克公理体系之外,还有几个不同的公理体系,它们定义的东西有着确实的差异。但对于大部分数学家来说,他们研究的数学无论建基在哪个公理体系上都可以,所以很多数学家并不关心逻辑根基到底是什么,他们只需要知道有一个稳固的根基,那就可以了。

太上,下知有之。


Mathemlogical

“公理”这个中文翻译非常有误导性!意义更准确的名词应该是“假设”或“公设”。

数学不是物理,任何一个数学“公理”,都没有义务要符合事实,符合直觉,符合常识。换句话说,如果你是一个数学家,正在开创一个体系,那么你在选择定义“公理”时是相当自由的,数学公理的意义在于:不需证明,我们就假设它们是对的,体系内其它命题则必须完全聪这些假设开始推导。

但数学家同时对“公理”(假设)又十分苛刻,任何一个数学体系里的公理必须符合几个要求:

1. 公理之间不可有矛盾(严谨性)

2. 公理不可以被其它公理所推导出来(独立性)

3. 公理的选择应使尽可能多的甚至所有的命题可以被判定真或伪(完备性)

关于独立性,最有名的争议就是欧几里得几何的第五公设(平行公理):过直线外一点有且仅有一条平行线。

两千年来数学家一直怀疑这是一条定理,应该可以从其它几条公理推导出来。但最终高斯,罗巴切夫斯基,波利亚等人证明了这就是公理,和其它公理是独立的。换句话说,我们完全可以换掉这条公理:比如过直线外一点没有平行线,或有无穷多条平行线,这也可以成为自洽的几何。这类几何被称为:非欧几何。

在当时(19世纪初)人们大多认为这样的公理显然是“不符合现实空间世界的”,但对于纯抽象的数学则无不可,非欧几何是数学家构造出来的想象中的空间。结果大家应该都知道了,大约100年后爱因斯坦发现我们身处的宇宙其实就是非欧空间,欧几里得那条看起来“显然符合常识的”平行公理其实并不符合现实。

这个例子说明:数学上构建体系时选择公理是有苛刻要求的,但不需要和现实物理世界吻合。欧氏几何,非欧几何,选用了完全相反的公理,都是可以的。

关于公理体系的严谨性和完备性,哥德尔定理证明了两者不可共存,该证明的前提是该公理体系“足够强大”,至少包含皮亚纳自然数公理体系。一个“不够强大的”公理体系的例子就是前述的欧几里得几何。

数学家可以自由自在的创造体系,选择公理。但并不是说所有选择和创造都是一样好的。时间是个大筛选器:能解决更多问题,更有影响力和追随者的创造会被留存和发扬光大,反之则逐渐被抛弃和遗忘。

所以即使是数学研究,宏观的看,也是符合达尔文的进化理论的。

“随机变异,自然选择”,这条公理(假设)看来是在各个领域都经受了时间的考验。


帖木兒

这个问题有毛病。1、所谓公理,是指其正确性为人们所公认,不需要证明和确认的事实。2、空间两点之间直线段最短。而不是直线最短。3、经过一点可以做无数条直线和射线。4、经过两定点的直线唯一,直线段唯一。5、经过空间三点能夠,且仅能夠确定唯一的平面。6、就有限数量而论,整体大于或等于部分。7、数学公理无须借助物理学或其他科学耒确认。8、无论自然科学或社会科学,都应当以哲学和数学为两大基础。

针对某人谈数学公理的确认,暂述8条以为申辩。

咸阳郑秦云


郑秦云

确立一套规范的公理体系,并以此为基础进行演绎推理,是数学,尤其是现代数学的核心研究方法。任何一个成熟的数学理论和数学概念,第一步都是要确立它所满足的公理体系。这一方法是由古希腊人开创的,欧几里得在他的《几何原本》中提出了几何学研究的五条公设作为推理的前提,在此基础上推导出了一系列复杂的数学结论。随后这一公理化研究的方法便成为西方科学发展的核心方法之一,发挥出巨大的威力,甚至影响到了其他学科的发展。例如17世纪唯理论哲学家斯宾诺莎的代表作《伦理学》,就是采用了几何学中先提公设再做推理最后得结论的研究方法来研究哲学问题,而20世纪初期罗素等人所开创的分析哲学,也是想把数学方法引入到哲学分析当中。


而在现代数学的研究中,数学分支日渐庞杂,理论高度抽象,层次不断深入,公理化方法甚至成为了数学研究的唯一方法。数学研究的路径逐步确立为:对现实世界或抽象形式进行观察与总结,对已有的数学概念进行本质分析,进而抽取出一套公理体系,并在此体系下进行逻辑推演从而发展出一整套数学理论。尤其是抽象代数这一门学科的诞生,将这种方法发挥到极致,其他诸如拓扑学,分析学等等,也都是采用的这样一套方法。

那么数学家们又是如何确立公理的呢?按照层次的不同主要分为两种途径。一是针对一些最基础的数学概念,如点线面,集合,自然数等等,我们是将一些所谓的“不证自明”的结论作为公理,这种方法主要集中在数理逻辑领域。二是针对抽象层次很高的数学概念,我们是来寻找一些已有的,具有共同特征的多个数学概念,总结出它们的共同特征,将此作为一套公理体系。下面就这两种途径我来详细地进行说明。

第一种途径比较容易理解,在数学发展的早期都采用的是这种途径。即有一些结论非常的显然和直观,很符合我们的感觉,我们可以利用这些结论来推导出其他结论,但是这些结论本身又很难证明,我们便将它们作为公理,例如几何学的肇始《几何原本》中的几条公理(或公设):两个直角彼此相等,两个量如果相等那他们加上同一个量仍然相等,都属于这种情况。再比如对于自然数这个概念,我们目前采用的是皮亚诺公理系统,这一系统中的一些公理如下,任何一个自然数加1(严格的数学概念称为为自然数的后继数"successor")还是自然数,两个自然数加一相等那这两个自然数也是相等的。再比如集合这个概念,我们采用的是ZFC公理系统,这一系统的一些公理如下,两个结合,如果含有的元素相同那这两个集合是相等的,两个集合的公共部分仍然是一个集合,等等。

当然,满足“非常显然和直观,但又很难证明”这样的结论有很多,那我们从中选取哪些作为公理呢?这主要是参照两个标准,一是对某个数学概念的公理体系的界定必须能清晰的说明这个数学概念的本质,不能产生歧义,更不能产生矛盾。比如自然数这个概念,它的本质就是一个一个往下列,因此我们的公理体系中会有一个自然数的后继者仍然是自然数这样一条。第二个标准就是所谓的三性:独立性,相容性与完备性,这是数理逻辑研究的领域,本文不再详细展开,大意是指公理与公理之间不能出现重复和矛盾,并且涉及该数学概念的所有真命题都可以从几条公理中找到答案。

按照这种途径确立的公理体系最著名的例子就是我们上大学都会学到的概率论。在20世纪以前,概率论的研究基本停留在用排列组合进行数数的阶段,即所谓的古典概率时期。而真正意义上的现代概率论,是从苏联数学家柯尔莫哥洛夫(Kolmogorov,1903-1987)开始的,他利用集合论和测度论的工具,确立了概率论研究的几条公理,开创了公理概率论这门学科,为了阅读的方便,本文不打算引入数学符号,只用直白的语言来叙述这几条公理:

1、任何一个事件发生的概率一定介于0和1之间

2、如果一个事件包含了所有可能的结果,那么他发生的概率一定是1

3、两个事件如果没有交集,那么他们发生的概率就是二者相加。(想象一下一个球队去踢球,赢球的概率是0.5,平局的概率是0.3,输球的概率是0.2,那么这场比赛不输球的概率就是0.5+0.3)


柯尔莫哥洛夫,苏联最伟大的数学家

可以看到,这三条公理非常清晰且自然地说明了“概率”这一现象的本质,我们目前接触到的概率论的所有结论,都是从这三条公理中及其相关概念中推导出来的。

用这一途径确定公理最大的缺陷就是所谓的“不证自明”,一个结论如何是显而易见并且不需要证明呢?显而易见只是每个人的自己的主观感受,又如何做到对同一个事情每个人的感受都一样呢。正因如此,这样确定的公理在历史上引起了巨大的争议,大名鼎鼎的非欧几何,就是数学家们认为《几何原本》中第五条公设不是那么显然,甚至不一定是正确的,进而发展出的一整套和理论。同时在集合论的公理中,选择公理也是这种情况。

而第二种途径确立的公理相比于第一种就可靠得多。即,我们已经有了一些数学概念,这些数学概念之间有几个共同的特征,我们把这几条共同的特征总结出来,就把它们作为一套公理系统。最著名的例子就是“群论”这一数学理论。比如我们有如下的数学概念:

1、所有的整数构成一个集合,整数之间存在一个运算叫做加法,这个加法运算有以下性质:满足结合律;有一个整数是0,任何整数加上0还等于自己;任何一个整数加上自己的相反数就等于这个零。

2、所有的实数构成一个集合,实数之间存在一个运算叫做乘法,这个乘法运算满足以下性质:满足结合律;有一个实数是1,任何实数乘以1还等于自己;任何一个实数乘以自己的倒数都等于这个1

3、所有的向量构成一个集合,上面存在一个运算叫做加法,这个运算满足以下性质:满足结合律;向量之间存在一个运算叫加法;有一个向量是零向量,任何向量加上零向量还等于自己;任何一个向量加上和自己相反的向量就等于这个零向量。


伽罗华, (Galois,1811-1832),群论的奠基人

上面是三个不同的数学概念,但是它们之间又具有相同的特征,我们把这个相同的特征提取来。有一个集合,它上面存在一个运算,满足三条性质:

1、这个运算满足结合律

2、集合中存在一个元素,使得集合中任何一个元素与该元素做运算都还等于自己,这个元素称之为幺元

3、对于集合中的任何一个元素,都存在与之对应的另一个元素,使得二者做运算的结果是幺元。

我们把这三条性质提取出来之后,为了研究的方便,给他们一个新的名字,称为群。于是上面三条结论就是群论的三条公理,所有有关群论的理论都是从这三条公理出发的。

这个例子就很好的说明了现代数学中公理是怎么产生的,因为现代数学研究的对象越来越复杂,很多概念混杂在一起便很难研究,很多性质交错在一起乱成一团,因此我们把一些具有共同特征的数学概念放在一起,提取出这一共同特征,便构成了新的数学概念,这些共同特征就是新概念的公理体系。这样做就使得我们的研究变得简洁并且清晰,在明确的公理体系之下推导出的结论,同样也适用于那些原有的概念,进而我们对那些原有概念的认识也会提升到一个新的高度,对它们的本质的认识就更加深刻。因此公理化方法就成了现代数学研究的核心方法


马丁156

数学界的两点之间直线最短在自然界可以认为是公理,如果在物理量子力学上找到两个点都是幻象,根本就没有静止的粒子点,在加上多维,粒子波的话,两个点是不存在的。可回过头来,两个点在引力波介面上又可以找到,又是现实的,这就有了结论:数学在自然界是两面性的。


分享到:


相關文章: