柏拉图,亚里士多德和机器学习

雅典学院是世界上最着名的壁画之一。这是一幅文艺复兴时期的杰作,描绘了古典时代的伟大哲学家,由拉斐尔于1509-1511年间所画。

柏拉图,亚里士多德和机器学习

雅典学院,拉斐尔的壁画,1509-11

虽然在这幅壁画中有很多值得讨论的内容,但我想提请你注意两个核心人物:柏拉图指向天空,他的学生亚里士多德指向地球。

柏拉图,亚里士多德和机器学习

柏拉图(左)和亚里士多德(右)

但拉斐尔为什么要这样描绘他们呢?

柏拉图认为,我们所生活的世界,物质世界,只是理想世界的阴影。例如,我们在这个世界上看到的苹果是一个完美苹果的不完美反映,它存在于理想世界中。柏拉图称这些完美或理想的东西是他们的形式,从而形成了他的形式理论。形式理论不仅限于对象,我们还可以谈论教育形式,友谊形式等。然而,亚里士多德反对他的老师并声称物质世界是真实的。他认为,在物质世界中,形式存在于所讨论的事物中。如果没有苹果,就没有苹果。他们都相信形式,但不同意它们是存在于另一个世界(柏拉图)还是存在于这个世界(亚里士多德)。

现在你可能会猜到拉斐尔想传达的信息,柏拉图指出天空,因为他相信形式在另一个世界,相反亚里士多德指出地球说形式实际上可以在物质世界中找到。

这一讨论涉及到形而上学的普遍性问题。普遍性是两个或两个以上的实体有共同之处的事物(例如,根据柏拉图的说法,是一只猫或一只理想的猫),而普遍性有被称为特殊性的实例。加菲猫是一种特殊的猫。他拥有所有猫科动物的共同特征,还有其他一些不是每只猫都有的属性,如懒惰、橙色等。

但是这一切与机器学习有什么关系呢?在回答这个问题之前,我将尝试解释在数据,信号和噪声方面的机器学习。我们首先澄清这些术语:

  • Data:您观察或测量的值。
  • Signal:观察或测量的预期值。
  • Noise:不完美导致预期值和观察值不同。

基于这些定义,我们可以说Data = Signal + Noise。让我试着用一个具体的例子来解释这个概念。

如何描绘物体(m = 2 kg)的力(N)与加速度(m /s²)的关系呢?理想情况下,它应遵循牛顿第二定律,F = m * a。然而,在我们生活的世界里,我们知道事情并不完美。因此,观察到的行为将类似于F = m * a +Noise。您可以在下面看到用于生成它们的图表和Python示例代码:

m=2 #mass of the object
a=10*np.random.rand(50,1) #50 random acceleration values
F_ideal=m*a #Ideal F
F_observed=m*a+np.random.randn(50,1) #Observed F
柏拉图,亚里士多德和机器学习

理想与观察行为

柏拉图,亚里士多德和机器学习

Data = Signal + Noise

本质上,机器学习算法试图学习数据内部的信号。重要的是要强调这些算法被赋予数据,但他们不知道数据的哪个部分是Signal,哪个部分是Noise。

例如,让我们将线性回归应用于上面生成的数据。您可以看到拟合几乎等于信号。机器学习算法不知道我用来生成这些数据的Signal,但它能够找到非常接近的数据。Python示例代码

import sklearn
from sklearn import linear_model
model = linear_model.LinearRegression()
model.fit(a, F_observed)
柏拉图,亚里士多德和机器学习

Fit试图找到Signal

现在我们可以看到机器学习和普遍性问题之间的对应关系。

  • 机器学习:Data = Signal + Noise
  • 通用问题:我们看到的=通用+特殊属性

想象一下,你的朋友要求你建造一个孟加拉猫分类器。你收集孟加拉猫图像(数据)并训练卷积神经网络(CNN)来完成这项任务。算法查看数据,将Signal(通用孟加拉猫)与Noise分开(特别是一只猫有疤痕,另一只图像背景有树等),从而了解一只理想的孟加拉猫应该是什么样子。该机器学习算法将其学习的内容存储为称为“权重”的参数。换句话说,训练后卷积神经网络(CNN)的权重对应于通用孟加拉猫 - Signal。

柏拉图,亚里士多德和机器学习

孟加拉猫(理想的孟加拉猫)的蓝图由卷积神经网络(CNN)的权重捕获。边缘由第一层捕获,第二层学习轮廓,第三层学习眼睛,耳朵和尾巴。

最后

这篇文章的关键点是机器学习算法的目的是学习数据中的通用(也称为Forms or signal)。希望这能帮助你从不同的角度看待机器学习中的一些概念,并更容易地理解它们。


分享到:


相關文章: