使用PyTorch進行遷移學習

2019-11-12 13:00:36 人工智能遇見磐創

介紹

我去年在一個計算機視覺項目中工作，我們必須建立一個健壯的人臉檢測模型。

考慮到我們擁有的數據集的大小，從頭構建一個模型是一個挑戰。從頭構建將是一個耗時又消耗計算資源的方案。由於時間緊迫，我們必須儘快找出解決辦法。

這就是遷移學習拯救我們的時候。這是一個非常有用的工具，可以放在你的數據科學家庫中，特別是當你使用有限的時間和計算能力時。

因此，在本文中，我們將學習有關遷移學習的所有內容，以及如何在使用Python的實際項目中利用它。我們還將討論預訓練模型在這個領域的作用，以及它們將如何改變構建機器學習pipeline(管道)的方式。

本文是面向初學者的PyTorch系列文章的一部分。我堅信PyTorch是目前最好的深度學習框架之一，在不久的將來會越來越強大。這是一個很好的時間來學習它是如何工作的，並參與其中。

1.遷移學習概論

讓我用一個例子來說明遷移學習的概念。想象一下，你想從一個你完全陌生的領域學習一個主題。

你會採取什麼不同的方法來理解這個主題?你可能會：

網上搜尋資源
閱讀文章和博客
參考書籍
尋找視頻教程，等等

所有這些都會幫助你熟悉這個主題。在這種情況下，你是唯一一個付出所有時間來熟悉主題的人。

但還有另一種方法，它可能在短時間內產生更好的結果。

你可以諮詢對你想要學習的主題具有能力的領域/主題專家。這個人會把他/她的知識傳授給你。從而加快你的學習過程。

第一種方法，即你獨自投入所有的努力，是從頭開始學習的一個例子。第二種方法被稱為遷移學習。知識轉移發生在一個領域的專家到一個面對新領域的新手。

是的，遷移學習背後的思想就是這麼簡單!

神經網絡和卷積神經網絡就是從零開始學習的例子。這兩個網絡都從給定的一組圖像中提取特徵(對於與圖像相關的任務)，然後根據這些提取的特徵將圖像分類到各自的類中。

這就是遷移學習和預訓練的模型非常有用的地方。讓我們在下一節中瞭解一下後一個概念。

2.什麼是預訓練模型?如何選擇正確的預訓練模型?

在你將要從事的任何深度學習項目中，預訓練的模型都是非常有用的。並非所有人都擁有頂級科技巨頭的無限計算能力，相反我們需要使用我們本地有限的機器，所以預訓練模型是一個強大的工具。

預訓練的模型通過將它們的權重和偏置傳遞給一個新模型來共享它們的學習。因此，當我們進行遷移學習時，我們首先選擇恰當的預訓練模型，然後將其已學習的權值和偏置傳遞給新模型。

有n種預訓練過的模型。我們需要決定哪種模式最適合我們的問題。現在，讓我們考慮一下我們有三個預訓練好的網絡——BERT、ULMFiT和VGG16。

我們的任務是對圖像進行分類(正如我們在本系列的前幾篇文章中所做的那樣)。那麼，你會選擇哪些預訓練好的模型呢?讓我先給你一個快速的概述這些預訓練的網絡，這將幫助我們決定正確的預訓練的模型。

語言建模使用BERT和ULMFiT，圖像分類任務使用VGG16。如果你看一下手頭的問題，這是一個圖像分類問題。所以我們選擇VGG16是理所當然的。

現在，VGG16可以有不同的重量，即VGG16訓練在ImageNet或VGG16訓練在MNIST:

ImageNet與MNIST

現在，為我們的問題確定正確的預訓練模型，我們應該研究這些ImageNet和MNIST數據集。ImageNet數據集由1000個類和總共120萬張圖像組成。這些數據中的一些類別是動物、汽車、商店、狗、食物、儀器等:

另一方面，MNIST是訓練手寫數字的。它包括10類從0到9:

我們將在一個項目中工作，我們需要將圖像分為緊急和非緊急車輛(我們將在下一節詳細討論)。這個數據集包括車輛的圖像，因此在ImageNet數據集上訓練的VGG16模型將更有用，因為它有車輛的圖像。

簡而言之，這就是我們應該如何根據我們的問題來決定正確的預訓練模型。

3.案例研究:緊急與非緊急車輛分類

我們將進行一個新的目標!這裡，我們的目標是將車輛分為緊急和非緊急。

現在讓我們開始理解這個問題並可視化一些示例。你可以通過這個鏈接下載圖片：https://drive.google.com/file/d/1EbVifjP0FQkyB1axb7KQ26yPtWmneApJ/view

首先，導入所需的庫:

接下來，我們將讀取包含圖像名稱和相應標籤的.csv文件:

csv文件有兩列:

image_names:它表示數據集中所有圖像的名稱
emergencyorno:它指定特定的圖像屬於緊急類還是非緊急類。0表示圖像是非緊急車輛，1表示緊急車輛

接下來，我們將加載所有的圖像，並將它們存儲為數組格式:

加載這些圖像大約需要12秒。在我們的數據集中有1646張圖像，由於VGG16需要所有這種特殊形狀的圖像，所以我們將它們的形狀全部重設為(224,224,3)。現在讓我們從數據集中可視化一些圖像:

這是一輛警車，因此有緊急車輛的標籤。現在我們將目標存儲在一個單獨的變量:

讓我們創建一個驗證集來評估我們的模型:

我們在訓練集中有1,481張圖像，在驗證集中有165張圖像。現在我們必須將數據集轉換為torch格式:

類似地，我們將轉換驗證集:

我們的數據準備好了!在下一節中，我們將構建一個卷積神經網絡(CNN)，然後使用預訓練模型來解決這個問題。

4.使用卷積神經網絡(CNNs)解決挑戰

我們終於到了模型製作部分!在使用遷移學習來解決這個問題之前，我們先用一個CNN模型為自己設定一個benchmark。

我們將構建一個非常簡單的CNN架構，它有兩個卷積層來提取圖像的特徵，最後是一個全連接層來對這些特徵進行分類:

現在讓我們定義優化器，學習率和損失函數為我們的模型，並使用GPU訓練模型:

這就是模型架構的樣子。最後，我們將對模型進行15個epoch的訓練。我將模型的batch_size設置為128(你可以嘗試一下):

這也會打印一份訓練總結。訓練損失在每個時期之後都在減少，這是一個好跡象。我們來檢查一下訓練和驗證的準確性:

我們的訓練正確率在82%左右，這是一個不錯的分數。下面檢查驗證的準確性:

# 驗證集預測
prediction_val = []
target_val = []
permutation = torch.randperm(val_x.size()[0])
for i in tqdm(range(0,val_x.size()[0], batch_size)):
 indices = permutation[i:i+batch_size]
 batch_x, batch_y = val_x[indices], val_y[indices]

 if torch.cuda.is_available():
 batch_x, batch_y = batch_x.cuda(), batch_y.cuda()

 with torch.no_grad():
 output = model(batch_x.cuda())

 softmax = torch.exp(output).cpu()
 prob = list(softmax.numpy())
 predictions = np.argmax(prob, axis=1)
 prediction_val.append(predictions)
 target_val.append(batch_y)
 
# 驗證集精確度
accuracy_val = []
for i in range(len(prediction_val)):
 accuracy_val.append(accuracy_score(target_val[i],prediction_val[i]))
 
print('validation accuracy: \\t', np.average(accuracy_val))

驗證的準確性為76%。現在我們已經有了一個基準，是時候使用遷移學習來解決緊急和非緊急車輛分類問題了!

5.使用PyTorch的遷移學習解決挑戰

我在上面已經提到了這一點，我在這裡重申一下——我們將使用在ImageNet數據集上訓練的VGG16預訓練模型。讓我們看看我們將遵循的步驟，以訓練模型使用遷移學習:

首先，我們將加載預訓練模型的權重——在我們的例子中是VGG16
然後我們將根據手頭的問題對模型進行微調
接下來，我們將使用這些預訓練的權重並提取圖像的特徵
最後，我們將使用提取的特徵訓練精細調整的模型

那麼，讓我們從加載模型的權重開始:

# 加載預訓練模型
model = models.vgg16_bn(pretrained=True)

現在我們將對模型進行微調。我們不訓練VGG16模型的層，因此讓我們固定這些層的權重:

# 固定模型權重
for param in model.parameters():
 param.requires_grad = False

由於我們只需要預測2個類，而VGG16是在ImageNet上訓練的，ImageNet有1000個類，我們需要根據我們的問題更新最後一層:

# 最後加一個分類器
model.classifier[6] = Sequential(
 Linear(4096, 2))
for param in model.classifier[6].parameters():
 param.requires_grad = True

因為我們只訓練最後一層，所以我將最後一層的requires_grad設置為True。我們將訓練設置為GPU:

# 檢查GPU是否可用
if torch.cuda.is_available():
 model = model.cuda()

現在，我們將使用該模型併為訓練和驗證圖像提取特性。我將batchsize設置為128(同樣，你可以根據需要增加或減少batchsize):

# batch大小
batch_size = 128

# 從訓練集提取特徵
data_x = []
label_x = []

inputs,labels = train_x, train_y

for i in tqdm(range(int(train_x.shape[0]/batch_size)+1)):
 input_data = inputs[i*batch_size:(i+1)*batch_size]
 label_data = labels[i*batch_size:(i+1)*batch_size]
 input_data , label_data = Variable(input_data.cuda()),Variable(label_data.cuda())
 x = model.features(input_data)
 data_x.extend(x.data.cpu().numpy()) 

 label_x.extend(label_data.data.cpu().numpy())

類似地，讓我們提取驗證圖像的特徵:

# 從驗證集提取特徵
data_y = []
label_y = []

inputs,labels = val_x, val_y

for i in tqdm(range(int(val_x.shape[0]/batch_size)+1)):
 input_data = inputs[i*batch_size:(i+1)*batch_size]
 label_data = labels[i*batch_size:(i+1)*batch_size]
 input_data , label_data = Variable(input_data.cuda()),Variable(label_data.cuda())
 x = model.features(input_data)
 data_y.extend(x.data.cpu().numpy())
 label_y.extend(label_data.data.cpu().numpy())

接下來，我們將這些數據轉換成torch格式:

# 轉換這些數據到torch格式
x_train = torch.from_numpy(np.array(data_x))
x_train = x_train.view(x_train.size(0), -1)
y_train = torch.from_numpy(np.array(label_x))
x_val = torch.from_numpy(np.array(data_y))
x_val = x_val.view(x_val.size(0), -1)
y_val = torch.from_numpy(np.array(label_y))

我們還必須為我們的模型定義優化器和損失函數:

# batch大小
batch_size = 128

# 30個epochs
n_epochs = 30

for epoch in tqdm(range(1, n_epochs+1)):

 # 跟蹤訓練與驗證集損失
 train_loss = 0.0
 
 permutation = torch.randperm(x_train.size()[0]) 


 training_loss = []
 for i in range(0,x_train.size()[0], batch_size):

 indices = permutation[i:i+batch_size]
 batch_x, batch_y = x_train[indices], y_train[indices]
 
 if torch.cuda.is_available():
 batch_x, batch_y = batch_x.cuda(), batch_y.cuda()
 
 optimizer.zero_grad()
 outputs = model.classifier(batch_x)
 loss = criterion(outputs,batch_y)

 training_loss.append(loss.item())
 loss.backward()
 optimizer.step()
 
 training_loss = np.average(training_loss)
 print('epoch: \\t', epoch, '\\t training loss: \\t', training_loss)

以下是該模型的摘要。你可以看到損失減少了，因此我們可以說模型在改進。讓我們通過觀察訓練和驗證的準確性來驗證這一點:

# 預測訓練集
prediction = []
target = []
permutation = torch.randperm(x_train.size()[0])
for i in tqdm(range(0,x_train.size()[0], batch_size)):
 indices = permutation[i:i+batch_size]
 batch_x, batch_y = x_train[indices], y_train[indices]

 if torch.cuda.is_available():
 batch_x, batch_y = batch_x.cuda(), batch_y.cuda()

 with torch.no_grad():
 output = model.classifier(batch_x.cuda())

 softmax = torch.exp(output).cpu()
 prob = list(softmax.numpy())
 predictions = np.argmax(prob, axis=1)
 prediction.append(predictions)
 target.append(batch_y)
 
# 訓練精度
accuracy = []
for i in range(len(prediction)):
 accuracy.append(accuracy_score(target[i],prediction[i]))
 
print('training accuracy: \\t', np.average(accuracy))

我們在訓練集上獲得了大約84%的準確性。現在讓我們檢查驗證的準確性:

# 預測驗證集
prediction = []
target = []
permutation = torch.randperm(x_train.size()[0])
for i in tqdm(range(0,x_train.size()[0], batch_size)):
 indices = permutation[i:i+batch_size]
 batch_x, batch_y = x_train[indices], y_train[indices]

 if torch.cuda.is_available():
 batch_x, batch_y = batch_x.cuda(), batch_y.cuda()

 with torch.no_grad():
 output = model.classifier(batch_x.cuda())

 softmax = torch.exp(output).cpu()
 prob = list(softmax.numpy())
 predictions = np.argmax(prob, axis=1)
 prediction.append(predictions)
 target.append(batch_y)
 
# 驗證精度
accuracy = []
for i in range(len(prediction)):
 accuracy.append(accuracy_score(target[i],prediction[i]))
 
print('training accuracy: \\t', np.average(accuracy))

模型的驗證精度也相似， 83%。訓練和驗證的準確性幾乎是同步的，因此我們可以說這個模型是廣義的。以下是我們的研究結果摘要:

Model Training Accuracy Validation Accuracy CNN 81.57% 76.26% VGG16
83.70% 83.47%

我們可以推斷，與CNN模型相比，VGG16預訓練模型的準確率有所提高！

6.結尾

在這篇文章中，我們學習瞭如何使用預訓練的模型和遷移學習來解決一個圖像分類問題。我們首先了解什麼是預訓練模型，以及如何根據手頭的問題選擇正確的預訓練模型。然後，我們以汽車圖像為例進行了緊急和非緊急圖像的分類研究。我們首先使用CNN模型解決了這個案例研究，然後使用VGG16預訓練模型解決了同樣的問題。

我們發現使用VGG16預訓練模型顯著提高了模型性能，並且與CNN模型相比，我們得到了更好的結果。我希望你現在已經清楚地瞭解瞭如何在使用PyTorch使用遷移學習和正確的預訓練模型來解決問題。

我鼓勵你試著用遷移學習來解決其他的圖像分類問題。這將幫助你更清楚地理解這個概念。

分享到:

閱讀更多 人工智能遇見磐創 的文章

關鍵字: CNN 機器學習 Python

第二章 IoC容器和Bean配置

bean是一個對象，它是由Spring

運算裡不得不說的python模塊—math

Help

Devops度量--DevOps 現狀快速檢查表

今天主要分享一個DevOps

SOP是什麼（解讀）

SOP不是單個的，是一個體系，雖然我們可以單獨地定義每一個SOP，但真正從企業管理來看，SOP不可能只是單個的，必然是一個整體和體系，也是企業不可或缺的。

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

隨著終端設備的越來越多，人工干預配置IP地址，不僅工作效率低，而且，還很容易導致IP衝突，影響正常的網絡訪問。到此已經完成了，DHCP服務的配置了，我們可以在終端驗證。

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

這兩天分析了一下頭條文章網頁的源文件，現在將分析的結果分享給大家。首先以一篇文章為例，其網址如下：https://www.toutiao.com/i6822245428176617998/如上圖網頁所示，文章中包含文字和圖片。

DNS偵查工具

我們只需要打開瀏覽器輸入例如:www.baidu.com就可以解析到該網站.為了便於記住不需要輸入長長的IP地址去訪問這就是DNS域名解析.關於域名域名的層次劃分用點來分割這時DNS把相對應的域名解析成IP地址高的在右邊.例如:www. NS簡介訪問某網站的時候最低在左邊

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

Create

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

最後一個要介紹的命令是

（必收藏系列）Linux面試題——命令集

關注，後臺私信【Linux】分享Linux入門到進階電子書、Linux入門到精通視頻教程（免費）。文件管理命令cat

五分鐘學會如何在 IPFS 上部署網站

原文標題:五分鐘學會如何在

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

1）實驗平臺：【正點原子】

小白怎麼學Web前端開發如何成為技術達人

Web前端開發工程師已經成為了很多年輕人心中的理想工作，不僅入行門檻低、而且薪資待遇和發展前景都不錯，自然吸引了大批人加入行業。

如何開發一個web靜態服務器

我們都知道如今的web服務器有很多，比如著名的有apache，有nginx，有tomcat，有resin服務器，有sphere，有iis服務器等等，這些服務器都能提供web服務，並且幾乎都能和多種語言進行搭配使用，那麼一個web服務器都需要那些功能，開發一個web服務器都需要那些

學Java編程還有前景嗎如何才能拿到高薪

需求大、薪資高似乎是Java開發人員的標籤，不過學Java編程還有前景嗎？它架構在操作系統之上，屏蔽了底層的差異，真正實現了“Writeonce run

Python網絡爬蟲之配置篇（一）

pip

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

serverTimezone=UTC&useUnicode=true&characterEncoding=utf-8&zeroDateTimeBehavior=convertTo&useSSL=falseusername:rootpassword:

Python的運行效率太低？幾行代碼快速提升！

return的就是是你所需要的結果2.3、運行這一步就是最後一步了，只要像下面一樣輸入上述函數名，賦予參數值，點擊運行Run，就能得到你想要的結果arg1=5

python的優點是什麼？最新Python400集視頻（附教程）

2020，最新Python零基礎到精通資料教材，乾貨分享，新基礎Python教材，穩穩找到過萬工作，看這裡，這裡有你想要的所有資源哦，最強筆記，教你怎麼入門提升！獲取方式：私信小編“

MySQL中OOM故障應如何下手-愛可生

作者：孫祚龍愛可生南區分公司交付服務部成員，實習工程師。負責公司產品問題排查及日常運維工作。本文來源：原創投稿*愛可生開源社區出品，原創內容未經授權不得隨意使用，轉載請聯繫小編並註明來源。

像專家一樣使用 panic

|go

30種不同的編程語言怎麼寫“Hello, World”

printfn

percona QAN 介紹

一、背景QAN慢查詢日誌分析工具是PMM

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

雖然沒什麼軟用，但是對付面試官應該是夠用了。感謝面試官提出的問題，讓我實現了這個功能，對CSS

網絡工程師職業生涯中，哪兩點是最重要的？

網絡工程師最重要的技能是紮實的基礎和非常開放的思維，微觀知識紮實、宏觀能力突出。項目經驗也會讓網絡工程師基礎更牢靠，網絡工程師是要實戰的，要避免紙上談兵，我認為對基礎理論的理解，比你清楚配置更重要。

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

有關以太坊2.0

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

yuminstall

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

今天的你捉住IPFS機遇了嗎？我們都知道在Filecoin網絡中作為一名存儲礦工，信譽對於我們是非常重要的——信譽越高，爆塊幾率越大。那麼信譽系統現在怎麼樣了呢？

Hive分桶表

fieldsterminated

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

編輯Exchange

$【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫$

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

在阿里雲控制檯，我們能下載的文件是一個壓縮包，解壓之後，是.idb和.frm文件，你可能要問了，我可以直接把解壓好的問題件覆蓋到MySQL的data目錄下嗎？

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

即，最大化

第一章 Spring Framework概述

您可以在任何web

opencv人工智能深度學習這樣實現人臉的年齡檢測

前期的文章我們分享了人臉的識別以及如何進行人臉數據的訓練，本期文章我們結合人臉識別的模型進行人臉年齡的檢測人臉年齡的檢測步驟1、首先需要進行人臉的檢測2、把檢測到的人臉數據給年齡檢測模型去檢測3、把檢測結果呈現到圖片上人臉年齡檢測import

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

圖8-1

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

先反思為何會有上述疑惑上述疑惑產生的原因，應該是受到平時使用HashMap的影響，HashMap獲取值就是在調用get方法時指定key，設置值也是在put時指定key，所以看到state.value，看懂了這些，其實也是在瞭解DataStream/DataSetAPI的設計思路：

Redis內存分析工具--rdr安裝與使用

分析Redis

資深架構師教你源碼講解zookeeper實現分佈式鎖以及集群搭建步驟

//getData發現前一個子節點被刪除，拋出異常

一行代碼提升遷移性能

論文原址：https://arxiv.org/pdf/2003.12237.pdf開源地址：https://github.com/cuishuhao/BNM在發表在CVPR2020

利用相似幾何信息，做可泛化3D形狀分割模型

更具體的有以下三種典型的分割方案：FullyConvolutional-Like

這麼好用的開源計算器SpeedCrunch，沒有不嘗試一下的道理

介紹SpeedCrunch是一款高精度科學計算器，具有快速，鍵盤驅動的用戶界面。獲取方式在GitHub上搜索SpeedCrunch，就可以去到

分佈式緩存，真香

他是前易寶支付架構師、阿里雲MVP、騰訊雲

特徵工程的力量

在本文中，我希望教給您一些有關特徵工程的知識，以及如何使用它來對非線性決策邊界進行建模。為了說明這一點，假設恢復時間與身高和體重具有以下關係：Y=β₀+β₁+β2+β₃+noise從第三項來看，我們可以看到Y與身高和體重沒有線性關係。

java架構：天天寫面向接口編程，你考慮過性能嗎？大神都是這麼寫

public

SpringBoot如何優雅的使用RocketMQ

源碼編譯需要Maven3.2x，JDK8在根目錄進行打包:Copymvn-Prelease-all

css代碼規範工具stylelint

"mixin"