0x00 人工神经网络介绍

人工神经网络（Artificial Neural Network，即ANN ），是20世纪80 年代以来人工智能领域兴起的研究热点。它从信息处理角度对人脑神经元网络进行抽象，建立某种简单模型，按不同的连接方式组成不同的网络。在工程与学术界也常直接简称为神经网络或类神经网络。神经网络是一种运算模型，由大量的节点（或称神经元）之间相互连接构成。每个节点代表一种特定的输出函数，称为激活函数（activation function）。每两个节点间的连接都代表一个对于通过该连接信号的加权值，称之为权重，这相当于人工神经网络的记忆。网络的输出则依网络的连接方式，权重值和激励函数的不同而不同。而网络自身通常都是对自然界某种算法或者函数的逼近，也可能是对一种逻辑策略的表达。

0x01 基础知识准备

本文需要读者了解以下内容：

激活函数
ANN的工作原理
ANN的学习原理
梯度下降
随机梯度下降
前向网络
反馈网络

对基础知识了解不太扎实的读者也不用担心，头条号后续会补充基础知识的相关文章。

0x02 环境搭建（Windows）

1、安装Anaconda，具体步骤请参考头条号文章《》

2、打开Anaconda Prompt

3、执行如下命令创建虚拟环境

conda create -n tensorflow python=3.5 anaconda

注意：

如果出现错误The path 'vcruntime140.dll' specified in the package manifest cannot be found.

说明是没有安装vs2015，安装vs2015即可解决

4、激活虚拟环境

activate tensorflow

5、安装Theano、TensorFlow、Keras

conda install theano
conda install mingw libpython
pip install tensorflow
pip install keras

6、更新所有软件到最新版本

conda update --all

7、运行 Spyder：

spyder

0x03 问题描述

现有一个包含10000条银行客户数据的数据集，包含银行客户的一些基本信息，如：客户ID，姓名，信用积分，国家，性别，年龄，与银行签约时长，资产，产品数，是否有信用卡，是否活跃，年薪和是否已经解约（也就是抛弃了这家银行），所有数据都是独立的。目前需要根据此数据集预测哪些客户倾向与这家银行解约，这样可以达到提前对这些客户做相应措施的目的。要数据集的朋友请看评论。

如下图所示，exited为1表示已解约，exited为0表示未解约

0x04 创建ANN模型

创建ANN模型分为两部分，第一部分为数据处理，第二部分为创建ANN模型。

本文问题为分类问题，我们需要筛选能够影响客户去留的输入数据，和客户留下或者离开的输出数据。

数据处理步骤如下：

1、导入需要的库

在spyder左侧的编辑框输入以下内容，并按control+enter执行它们

import numpy as np
import matplotlib.pyplot as plt
import pandas as pd

2、导入数据集

执行下面代码

dataset = pd.read_csv('Churn_Modelling.csv')
X = dataset.iloc[:, 3:13].values
y = dataset.iloc[:, 13].values

dataset，X，y变量分别为：

dataset

3、将分类变量列转换成二进制数。

执行如下语句：

from sklearn.preprocessing import LabelEncoder, OneHotEncoder
labelencoder_X_1 = LabelEncoder()
X[:, 1] = labelencoder_X_1.fit_transform(X[:, 1])
labelencoder_X_2 = LabelEncoder()
X[:, 2] = labelencoder_X_2.fit_transform(X[:, 2])
onehotencoder = OneHotEncoder(categorical_features = [1])
X = onehotencoder.fit_transform(X).toarray()
X = X[:, 1:]

其中涉及到了OneHot编码的知识。简单来说就是将每种分类用二进制的一位表示，是哪种分类哪一位就是1，其它位就是0。

执行之后的X如下图所示：