神經網絡與決策樹Python實現技术頭條網

神經網絡與決策樹Python實現

2019-11-05 17:48:41 邵寒峰

1. 實驗基本原理及目的

神經網絡算法：

輸入：

N //初始神經網絡

X //訓練集的輸入元祖

D //期望的輸出元祖

輸出：N //改進的神經網絡（權重、偏倚）

有指導學習算法 //神經網絡學習過程

step1:通過網絡N輸入X ，產生輸出Y;

step2:比較期望輸出D和實際輸出Y；

step3:更新網絡中的權重和偏倚值使誤差下降；

輸入：

N //初始神經網絡

X={x1,x2….xh} //訓練集的輸入元組

D={d1, d2, …dn} //期望的輸出元組

輸出：

N //改進的神經網絡（調整的權重和偏倚）

反向傳播算法：

Propagation(N, X) //正向輸入

計算均方誤差 //計算MSE

Gradient(N, E) //梯度下降算法調整網絡權值

決策樹分類：

算法：Generate_decision_tree：由給定的訓練數據產生一棵判定樹

輸入：訓練樣本D：訓練元祖和它們對應的類標號的集合

元組屬性列表： attribute_list

Attribute_selection_method()：一個確定“最好地”劃分數據元祖為個

體類的分裂準則的過程（或方法）

輸出：一棵判定樹。

方法：

(1) 創建結點 N；

(2) if samples 都在同一個類C then

(3) return N 作為葉結點，以類C標記；

(4) if attribut_list 為空 then //無剩餘屬性可劃分

(5) return N 作為葉結點，標記為D中多數類； //多數表決

(6) 使用Attribute_selection_method(D, attribute_list) 選擇最好的splitting_criterion

(7) 標記結點 N 為test_attribute；

(8) If splitting_attribute是離散值，允許多路劃分，then //不限二叉樹

(9) attribute_list  attribute_list - splitting_attribute; //刪除分裂屬性

//劃分元組並對每個分區產生子樹

(10) for splitting_criterion的每個輸出j （三種劃分）

//其中一個分區Di（j=1,2…n）

(11) 設Dj 是D 中滿足輸出j的數據元組的集合；

(12) if Dj 為空then

(13) 加上一個樹葉到結點N，標記為D中的多數類；

(14) else 加上一個由 Generate_decision_tree(Di, attribute_list)返

回的結點N； //遞歸劃分

endfor

(15) 返回N；

2. 數據的準備及數據預處理

2.1神經網絡

將數據讀入，按8：2分別分為訓練集和測試集data_practice，data_predict。

2.2決策樹分類

將數據讀入，按8:2分別分為訓練集和測試集data_practice，data_predict。

3. 實驗過程

3.1神經網絡

1. 函數介紹：

read(datafile)：數據預處理函數，datafile為文件所在位置，返回值為data_practice_x, data_practice_y,data_predict_x,data_predict_y分別為訓練集的屬性，標籤，預測集屬性，標籤。

cm_plot(t1,output)：畫圖函數，畫出混淆矩陣，t1為數據的真實標籤，output為預測標籤。

2.源碼：

#-*- coding: utf-8 -*-

from keras.models import Sequential

from keras.layers import Dense

import numpy as np

import pandas as pd

#數據預處理函數

def read(datafile):

df=pd.read_excel(datafile)

length=len(df)

data_practice=df[0:int(length*0.8)]

data_predict=df[int(length*0.8):]

data_practice_x=np.array(data_practice)[0:,0:3]

data_practice_y=np.array(data_practice)[0:,3:4]

data_predict_x=np.array(data_predict)[0:,0:3]

data_predict_y=np.array(data_predict)[0:,3:4]

return data_practice_x,data_practice_y,data_predict_x,data_predict_y

#混淆矩陣畫圖

def cm_plot(t1,output):

from sklearn.metrics import confusion_matrix

cm=confusion_matrix(t1,output)

# print(cm)

# print(len(cm))

import matplotlib.pyplot as plt

plt.matshow(cm,cmap=plt.cm.Greens)

plt.colorbar()

for x in range(len(cm)):

for y in range(len(cm)):

plt.annotate(cm[x,y],xy=(x,y),horizontalalignment='center',verticalalignment='center')

plt.ylabel('True label')

plt.xlabel('Predict label')

return plt

datafile='D:/ProgramData/file7/model.xls'

practice_x,practice_y,predict_x,predict_y=read(datafile)

#構建模型，輸入節點有3個，隱含節點有5個，輸出節點為1個

model = Sequential()

model.add(Dense(5, input_dim=3, activation='relu'))

model.add(Dense(1, activation='sigmoid'))

#編譯網絡

model.compile(loss='mse', optimizer='sgd', metrics=['accuracy'])

#訓練網絡

history = model.fit(practice_x, practice_y, epochs=100,batch_size=10)

#評價網絡

loss, accuracy = model.evaluate(practice_x, practice_y)

print("\\n損失函數值: %.2f, 分類準確率: %.2f%%" % (loss, accuracy*100))

#進行預測

probabilities = model.predict(predict_x)

for i in range(0,len(probabilities)):

if probabilities[i]<0.5:

probabilities[i]=0

else:

probabilities[i]=1

k=0

for i in range(0,len(probabilities)):

if predict_y[i]==probabilities[i]:

k=k+1;

accuracy=k/len(probabilities)

print("預測準確率: %.2f%%" % (accuracy*100))

cm_plot(probabilities,predict_y)

3.2決策樹分類

1. 函數介紹：

2.源碼

# -*- coding: utf-8 -*-

import pandas as pd

from sklearn.tree import DecisionTreeClassifier

from sklearn.metrics import classification_report

from sklearn import tree

#數據預處理函數

def read(datafile):

df=pd.read_excel(datafile)

length=len(df)

data_practice=df[0:int(length*0.8)]

data_predict=df[int(length*0.8):]

data_practice_x=data_practice[['電量趨勢下降指標','線損指標','告警類指標']]

data_practice_y=data_practice[['是否竊漏電']]

data_predict_x=data_predict[['電量趨勢下降指標','線損指標','告警類指標']]

data_predict_y=data_predict[['是否竊漏電']]

return data_practice_x,data_practice_y,data_predict_x,data_predict_y

datafile='D:/ProgramData/file7/model.xls'

practice_x,practice_y,predict_x,predict_y=read(datafile)

#進行分類

dtc = DecisionTreeClassifier()

dtc.fit(practice_x,practice_y)

test_y = dtc.predict(predict_x)

#進行評價

print('Accracy:',dtc.score(predict_x,predict_y))

print(classification_report(predict_y,test_y))

#輸出為dot圖像

with open("jueceshu.dot", 'w') as f:

f = tree.export_graphviz(dtc, out_file = f)

4. 實驗結果分析

4.1神經網絡

輸出結果：

混淆矩陣：

有兩個標籤分類錯誤，結果比較準確。

4.2決策樹分類

運行結果：

輸出的決策樹如附件所示：

convertoutput.pdf

有兩個標籤分類錯誤，結果比較準確。

分享到:

閱讀更多 邵寒峰 的文章

關鍵字: Python 人工智能實現

神經網絡與決策樹Python實現

相關文章:

mysql 實現 mssql exec 動態查詢語句

Python 實現 黑客帝國中的字符雨

ZStack 3.8.0發佈！實現雲主機內部監控

Python 實現“按任意鍵返回”和無回顯輸入

C語言經典面試題,斐波拉西數列(遞歸，循環)實現,超簡單

Spring註解方式 實現 IOC 和 DI

《常用數據挖掘算法總結及 Python 實現》

OkHttp 實現 WebSocket 真的太好用了，聊聊長連接如何保活

python 實現 PDF 添加水印

03.07 Java 實現 FastDFS 實現文件的上傳、下載、刪除

這個開源項目讓你使用 Java 8 實現 JVM

03.04 這個開源項目讓你使用 Java 8 實現 JVM

十大排序算法-快速排序 PHP 實現

使用 Cortex 實現 Prometheus 的多租戶管理

“搜索”的原理，架構，實現，實踐，面試不用再怕了

MVCC 實現

vue 實現@功能在一個div裡邊加標籤和可以輸入編輯

如何用 Python 實現 TCP 的連接與通信？

使用 Jacoco 實現 Android 端手工測試覆蓋率統計

.NET Core 實現 Redis 批量查詢指定格式的Key

epoll 原理（三）poll 實現

epoll 原理（二）select 實現

Nginx 實現 Rewrite 跳轉

「轉」“搜索”的原理，架構，實現，實踐，面試不用再怕了

「MySQL」 Mycat 實現 MySQL讀寫分離

mybatis 實現 SQL 查詢攔截修改詳解

阿里P7講解如何用Java 11實現清潔架構Clean Architecture

python 實現 2048 遊戲（二）

python 實現 2048 遊戲（一）

HTML5 網絡拓撲圖整合 OpenLayers 實現 GIS 地圖應用

從零實現Vue的組件庫（三）-Tabs 實現

從零實現Vue的組件庫（二）-Slider 實現

從零實現Vue的組件庫（一）-Toast 實現

NodeJS 實現 客戶端 js 加密

Spring框架詳解之——AOP動態代理底層原理

HTTPS通信的C++實現

徒手擼框架——實現 RPC 遠程調用

C++11中智能指針的原理、使用、實現

實現：Node.js上的JavaScript Servlet的方式

08.29 Spring Bean的生命週期，安排

深度學習教程：從頭開始用 PyTorch 實現 YOLO (v3)（一）

08.17 Runnable接口實現線程計數程序

JAVA中多態的上下轉型及應用中的利弊，實現「我愛你」的表白語句

重磅！美圖技術團隊發布開源 Ethereum DPoS 實現

使用 Quagga 實現 Linux 動態路由

03.15 設計模式---責任鏈模式(C++實現)

Dijkstra的c++實現

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

在農村“立夏節”都有哪些民間習俗？

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

工程分包乙方人員傷殘誰承擔？

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

上有老下有小，我們真的跳不出這個人生循環了嗎？

如果外面正在下小雨，你會突然想起了誰？

初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？

Python 實現黑客帝國中的字符雨

Spring註解方式實現 IOC 和 DI

NodeJS 實現客戶端 js 加密

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？