什麼是非線性降維?

硅發佈

高維數據,即需要超過二維或三維數據表示的數據,可能難以解釋。一種簡化的方法是假定感興趣的數據位於高維空間內的嵌入非線性流形上。如果歧管的尺寸足夠小,則數據可以在低維空間中可視化。

考慮一個表示為矩陣(或數據庫表)的數據集,以便每行代表描述特定事例的一組屬性(或特徵或維度)。如果屬性的數量很大,那麼唯一可能的行的空間是指數級大的。因此,維數越大,採樣空間越困難。這導致許多問題。對高維數據進行操作的算法往往具有非常高的時間複雜度。例如,許多機器學習算法都與高維數據相矛盾。這已成為維度的詛咒。將數據減少到更少的維度通常會使分析算法更高效,並且可以幫助機器學習算法做出更準確的預測。

人類在很多方面往往難以理解數據。因此,將數據減少到少量維度對於可視化目的非常有用。

NLDR在計算機視覺領域有幾個應用。例如,考慮使用相機在閉合的靜態環境中導航的機器人。由相機獲得的圖像可以被認為是高維空間中流形上的樣本,該流形的內在變量將代表機器人的位置和方向。該實用程序不限於機器人。動態系統是包括機器人在內的更一般的系統類別,它是根據多方面來定義的。NLDR的積極研究試圖展開與動力系統相關的觀測流形,開發模擬這些系統的技術並使其能夠自主操作。

Sammon的映射是第一個也是最受歡迎的NLDR技術之一。



分享到:


相關文章: