03.01 卡爾曼濾波器介紹

卡爾曼濾波器介紹

與我的朋友交談時,我經常聽到:“哦,卡爾曼(Kalman)濾波器……我經常學它,然後我什麼都忘了”。好吧,考慮到卡爾曼濾波器(KF)是世界上應用最廣泛的算法之一(如果環顧四周,你80%的技術可能已經在內部運行某種KF),讓我們嘗試將其弄清楚。

在這篇文章的結尾,你將對KF的工作原理,其背後的想法,為什麼需要多個變體以及最常見的變體有一個直觀而詳細的瞭解。

狀態估計

KF是所謂的狀態估計算法的一部分。什麼是狀態估計?假設你有一個系統(讓我們將其視為黑箱)。黑箱可以是任何東西:你的風扇,化學系統,移動機器人。對於這些系統中的每一個,我們都可以定義一個狀態。狀態是我們關心的變量向量,可以描述系統處於特定時間點的“狀態”(這就是為什麼將其稱為狀態)。“可以描述”是什麼意思?這意味著,如果你瞭解當時的狀態向量k和提供給系統的輸入,則可以瞭解當時的k+1的系統狀態(與此同時使用系統工作原理的一些知識)。

例如,假設我們有一個移動的機器人,並且我們關心其在空間中的位置(並且不在乎其方向)。如果我們將狀態定義為機器人的位置(x, y)及其速度,($vx$, $vy$)並且我們有一個機器人如何運動的模型,那麼就足以確定機器人的位置以及下一個時刻的位置。

因此,狀態估計算法估計系統的狀態。為什麼要估算呢?因為在現實生活中,外部觀察者永遠無法訪問系統的真實狀態。通常有兩種情況:你可以測量狀態,但是測量結果會受到噪聲的影響(每個傳感器只能產生一定精度的讀數,可能對你來說還不夠),或者你無法直接測量狀態。一個例子可能是使用GPS計算上述移動機器人的位置(我們將位置確定為狀態的一部分),這可能會給你帶來多達10米的測量誤差,對於你可能想到的任何應用程序來說,這可能都不夠精確。

通常,當你進行狀態估計時,你可以放心地假設你知道系統的輸入(因為是你給出的)和輸出。由於測量了輸出,因此它也會受到一定的測量噪聲的影響。據此,我們將狀態估計器定義為一個系統,該系統接收你要估計其狀態的系統的輸入和輸出並輸出系統狀態的估計。

傳統上,狀態用表示x,輸出用y或z,u是輸入,$tilde_x$是估計狀態。

卡爾曼濾波器介紹

卡爾曼濾波器

你可能已經注意到,我們已經討論了一些有關誤差的內容:

  • 你可以測量系統的輸出,但是傳感器會給出測量誤差
  • 你可以估計狀態,但是作為狀態估計它具有一定的置信度。

除此之外,我說過,你需要某種系統知識,你需要了解系統“行為”的模型(稍後會詳細介紹),你的模型當然並不完美,因此你將擁有另一個誤差。

在KF中,你可以使用高斯分佈來處理所有這些不確定性。高斯分佈是表示你不確定的事物的一種好方法。你當前確定的東西可以用分佈的均值表示,而標準差可以說明你對該確定的信心。

在KF中:

  • 你的估計狀態將是具有一定均值和協方差的高斯隨機變量(它將告訴我們該算法“確定”其當前估計的程度)
  • 你對原始系統的輸出度量的不確定性將用均值為0和一定協方差的隨機變量表示(這將告訴我們我們對度量本身的信任程度)
  • 系統模型的不確定性將由均值為0和一定協方差的隨機變量表示(這將告訴我們我們對使用的模型有多信任)。

讓我們舉一些例子來了解其背後的想法。

  1. 不良模型,好的傳感器,讓我們再次假設你要跟蹤機器人的位置,並且你在傳感器上花費了很多錢,它們為你提供釐米級的精度。另一方面,你根本不喜歡機器人技術,搜索了一下,發現了一個非常基本的運動模型:隨機遊走(基本上是一個僅由噪聲給出運動的粒子)。很明顯,你的模型不是很好,不能真正被信任,而你的測量結果卻很好。在這種情況下,你可能將使用非常窄的高斯分佈(小方差)來建模測量噪聲,而使用非常寬的高斯分佈(大方差)來建模不確定性。
  2. 傳感器質量差,模型好,如果傳感器質量不好(例如GPS),但是你花費大量時間對系統進行建模,則情況恰好相反。在這種情況下,你可能將使用非常窄的高斯分佈(小方差)來建模模型不確定性,而使用非常寬的高斯分佈(大方差)來建模噪聲。
卡爾曼濾波器介紹

估計的狀態不確定性如何?

KF將根據估計過程中發生的事情進行更新,你唯一要做的就是將其初始化為足夠好的值。“足夠好”取決於你的應用程序,你的傳感器,你的模型等。通常,KF需要一點時間才能收斂到正確的估計值。

KF如何工作?

正如我們所說,要讓KF正常工作,你需要對系統有“一定的瞭解”。特別是對於KF,你需要兩個模型:

  • 狀態轉換模型:某些函數,給定時間步k的狀態和輸入,給出時間步k+1的狀態。
  • 測量模型:某個函數,給定時間步k的狀態,即可為你提供同一時間的測量結果

稍後,我們將瞭解為什麼需要這些功能,讓我們首先查看一些示例以瞭解它們的含義。

狀態轉換模型

該模型告訴你係統如何隨時間變化(如果你還記得的話,我們之前曾談到狀態必須具有足夠的描述性以及時推斷系統行為)。這在很大程度上取決於系統本身以及你對系統的關心。如果你不知道如何對系統建模,則可以使用一些Google搜索來提供幫助。對於運動的物體(如果以適當的採樣率測量),可以使用恆速模型(假定物體以恆定的速度運動),對於車輛,可以使用單輪腳踏車模型,等等……讓我們假設一種或另一種方式,我們建立了一個模型。我們在這裡做出一個重要的假設,這對於KF的工作是必要的:你的當前狀態僅取決於先例。換句話說,系統狀態的“歷史”會壓縮為先前的狀態,也就是說,給定先例狀態,每個狀態都獨立於過去。這也稱為馬爾可夫假設。如果這不成立,你將無法僅根據先例來表達當前狀態。

測量模型(Measurement model)

測量模型告訴你如何將輸出和狀態聯繫在一起。直觀上,你需要這樣做,因為你知道測量的輸出,並且想要在估計期間從中推斷出狀態。同樣,此模型因情況而異。例如,在移動機器人示例中,如果你的狀態是位置並且你擁有GPS,則你的模型就是單位函數(identity function),因為你已經在知道了狀態的有噪聲版本。

每個步驟的數學公式和解釋如下:

卡爾曼濾波器介紹

那麼,KF實際如何運作?該算法分兩個步驟工作,稱為預測和更新。假設我們在時間步k,並且那時我們具有估計狀態。首先,我們使用狀態轉換模型,並使估計狀態預測到下一個時刻。這相當於說:鑑於我目前對狀態的信念,我所擁有的輸入以及對系統的瞭解,我希望我的下一個狀態是這樣。這是預測步驟。

現在,由於我們還具有輸出和測量模型,因此我們實際上可以使用實際測量“校正”預測。在更新步驟中,我們採用預期狀態,我們計算輸出(使用測量模型)(2),並將其與實際測量的輸出進行比較。然後,我們以“智能方式”使用兩者之間的差異來校正狀態估計(3)。

通常,我們在校正之前用apex -表示狀態的估計,它來自於預測步驟。K是卡爾曼增益。這就是巧妙之處:K取決於我們對度量的信任程度,取決於我們對當前估計的信任程度(這取決於我們對模型的信任程度),根據這些信息,K“決定”預測的估計在多大程度上被測量糾正。如果我們的測量噪聲與我們對來自預測步驟的估計的信任程度相比是“小”的,我們將使用測量對估計進行大的校正,如果相反,我們將對其進行最小程度的校正。

注意:為簡單起見,我寫方程式時就好像在處理普通變量一樣,但是你必須考慮到在每一步中我們都在處理隨機的高斯變量,因此我們還需要通過函數傳播變量的協方差,而不僅僅是均值。

讓我們舉例說明。假設我們正在(再次)跟蹤一個機器人的位置。實際位置顯示為灰色,k時刻我們認為機器人處於綠色位置,估計協方差表示為一個橢圓。粗略地說,你可以從橢圓的形狀看出,我們的過濾器在這一步對橫向定位比在向前運動方向的定位更“自信”。在使用狀態轉換模型讓系統演進的預測步驟之後,我們認為新的位置是紅色的。由於橢圓在橫向上變大了,我們現在對新的估計位置不太確定(例如,因為我們不太相信模型)。然後我們讀取GPS,得到黑色的位置。在更新步驟中,實際的位置估計將是深綠色的虛線部分。如果我們更信任模型(與測量噪聲協方差相比,協方差更小),估計值將更接近紅色;如果我們更信任測量(與模型不確定性相比,噪聲測量協方差更小),估計值將更接近紅色。

卡爾曼濾波器介紹

KF家族

根據所使用的模型類型(狀態轉換和測量),可以將KF分為兩個大類:如果模型是線性的,則具有線性卡爾曼濾波器,而如果它們是非線性的,則具有非線性卡爾曼濾波器。

為什麼要區分?好吧,KF假設你的變量是高斯變量,當通過線性函數傳遞時,高斯變量仍然是高斯變量,如果通過非線性函數傳遞,則不正確。這打破了卡爾曼假設,因此我們需要找到解決方法。

歷史上,人們發現了兩種主要的方法:利用模型作弊和利用數據作弊。如果你在模型上做了弊你基本上是將當前估計周圍的非線性函數線性化,這樣你就回到了線性的情況下。這種方法稱為擴展卡爾曼濾波(EKF)。這種方法的主要缺點是必須能夠計算f()和h()的雅可比矩陣。或者,如果你在數據上作弊,你使用非線性函數,然後你嘗試“高斯化”(如果這個詞存在的話)你做出的非高斯分佈。這是通過一種叫做無損變換的智能採樣技術實現的。這個變換允許你用平均值和協方差來描述(近似地)一個分佈(只有高斯分佈才能被前兩個矩完全描述)。這種方法稱為無損卡爾曼濾波(UKF)。理論上,UKF優於EKF,因為無損變換比線性化模型得到的近似更接近結果分佈。在實踐中,你必須有相當大的非線性才能真正看到大的區別。

實際中的KF

由於我談到了很多有關帶GPS的移動機器人的內容,因此我就此情況作了簡短的演示(如果要使用它,可以在這裡找到代碼)。機器人的運動是使用單輪模型生成的。用於KF的狀態轉換模型是等速模型,其狀態包含x和y位置,轉向角及其導數。

機器人會及時移動(實際位置顯示為黑色),在每個步驟中,你都會得到非常嘈雜的GPS測量值,該測量值給出x和y(紅色)並估算位置(藍色)。你可以使用不同的參數,看看它們如何影響狀態估計。如你所見,我們可以進行非常嘈雜的測量,並對實際位置進行很好的估算。

卡爾曼濾波器介紹

獎勵:卡爾曼增益的直觀含義

讓我們看一下線性KF情況下卡爾曼增益的公式,並試圖更深入地瞭解增益的工作原理。

卡爾曼濾波器介紹

其中$P_k$,當前估算狀態的協方差(我們對估算的信心程度)C是測量模型的線性變換,其中y(k) = Cx(k)和R是測量噪聲的協方差矩陣。請注意,分數符號並不是真正正確的,但是可以使發生的事情更容易可視化。

根據等式,如果R變為0,則我們有:

卡爾曼濾波器介紹

代入我們定義(3)的算法步驟,可以看到我們將完全忽略預測步驟的結果,並且使用測量模型的逆變換來獲得僅來自測量的狀態估計。

相反,如果我們非常信任模型/估計,$P_k$則將趨於0,得出:

卡爾曼濾波器介紹

因此,我們得到的最終估計與預測步長輸出相同。

需要注意的是,我正在交替使用“信任模型”和“信任當前估計”。他們是不一樣的但是他們是相關的,因為我們有多麼信任預測的評估是我們有多信任模型(如預測步驟完成只使用模型)與我們有多麼信任前一步的濾波的組合。

獎勵2:庫

有很多不錯的庫可以在線計算KF,這是我的一些最愛。

作為一個GO愛好者,我將從這個非常不錯的GO庫開始,其中包含幾個預實現的模型:

https://github.com/rosshemsley/kalman

對於Python,你可以查看

https://pykalman.github.io/

結論:我們深入研究了狀態估計是什麼,卡爾曼濾波器的工作原理,其背後的直覺是什麼,如何使用它們以及何時使用。我們介紹了一個玩具(但現實生活中)的問題,並介紹瞭如何使用卡爾曼濾波器解決該問題。然後,我們更深入地研究了Kalman濾波器在幕後的實際作用。


分享到:


相關文章: