雅典学院是世界上最着名的壁画之一。这是一幅文艺复兴时期的杰作，描绘了古典时代的伟大哲学家，由拉斐尔于1509-1511年间所画。

雅典学院，拉斐尔的壁画，1509-11

虽然在这幅壁画中有很多值得讨论的内容，但我想提请你注意两个核心人物：柏拉图指向天空，他的学生亚里士多德指向地球。

柏拉图（左）和亚里士多德（右）

但拉斐尔为什么要这样描绘他们呢？

柏拉图认为，我们所生活的世界，物质世界，只是理想世界的阴影。例如，我们在这个世界上看到的苹果是一个完美苹果的不完美反映，它存在于理想世界中。柏拉图称这些完美或理想的东西是他们的形式，从而形成了他的形式理论。形式理论不仅限于对象，我们还可以谈论教育形式，友谊形式等。然而，亚里士多德反对他的老师并声称物质世界是真实的。他认为，在物质世界中，形式存在于所讨论的事物中。如果没有苹果，就没有苹果。他们都相信形式，但不同意它们是存在于另一个世界（柏拉图）还是存在于这个世界（亚里士多德）。

现在你可能会猜到拉斐尔想传达的信息，柏拉图指出天空，因为他相信形式在另一个世界，相反亚里士多德指出地球说形式实际上可以在物质世界中找到。

这一讨论涉及到形而上学的普遍性问题。普遍性是两个或两个以上的实体有共同之处的事物(例如，根据柏拉图的说法，是一只猫或一只理想的猫)，而普遍性有被称为特殊性的实例。加菲猫是一种特殊的猫。他拥有所有猫科动物的共同特征，还有其他一些不是每只猫都有的属性，如懒惰、橙色等。

但是这一切与机器学习有什么关系呢？在回答这个问题之前，我将尝试解释在数据，信号和噪声方面的机器学习。我们首先澄清这些术语：

Data：您观察或测量的值。
Signal：观察或测量的预期值。
Noise：不完美导致预期值和观察值不同。

基于这些定义，我们可以说Data = Signal + Noise。让我试着用一个具体的例子来解释这个概念。

如何描绘物体（m = 2 kg）的力（N）与加速度（m /s²）的关系呢？理想情况下，它应遵循牛顿第二定律，F = m * a。然而，在我们生活的世界里，我们知道事情并不完美。因此，观察到的行为将类似于F = m * a +Noise。您可以在下面看到用于生成它们的图表和Python示例代码：

m=2 #mass of the object
a=10*np.random.rand(50,1) #50 random acceleration values
F_ideal=m*a #Ideal F
F_observed=m*a+np.random.randn(50,1) #Observed F

理想与观察行为

Data = Signal + Noise

本质上，机器学习算法试图学习数据内部的信号。重要的是要强调这些算法被赋予数据，但他们不知道数据的哪个部分是Signal，哪个部分是Noise。

例如，让我们将线性回归应用于上面生成的数据。您可以看到拟合几乎等于信号。机器学习算法不知道我用来生成这些数据的Signal，但它能够找到非常接近的数据。Python示例代码

import sklearn
from sklearn import linear_model
model = linear_model.LinearRegression()
model.fit(a, F_observed)

Fit试图找到Signal

现在我们可以看到机器学习和普遍性问题之间的对应关系。

机器学习：Data = Signal + Noise
通用问题：我们看到的=通用+特殊属性

想象一下，你的朋友要求你建造一个孟加拉猫分类器。你收集孟加拉猫图像（数据）并训练卷积神经网络（CNN）来完成这项任务。算法查看数据，将Signal（通用孟加拉猫）与Noise分开（特别是一只猫有疤痕，另一只图像背景有树等），从而了解一只理想的孟加拉猫应该是什么样子。该机器学习算法将其学习的内容存储为称为“权重”的参数。换句话说，训练后卷积神经网络（CNN）的权重对应于通用孟加拉猫 - Signal。