什麼是幾何深度學習？

已發表: 2020-12-22

在過去的幾年中，遞歸神經網絡 (RNN) 和卷積神經網絡 (CNN) 等深度學習算法在解決語音識別、計算機視覺等各個領域的問題方面做出了重要的工作。儘管結果具有很高的準確性，但它主要適用於歐幾里得數據。

但是當涉及到網絡科學、物理學、生物學、計算機圖形學和推薦系統時，我們必須處理非歐幾里得數據，即流形和圖。幾何深度學習處理這種非歐幾里得數據，將深度學習技術作為一個整體來處理流形或圖形結構數據。

在過去的幾年裡，我們看到了深度學習和機器學習領域的顯著進步。計算機能力正在迅速增長，可用數據與 1980 年至 1990 年為新應用開發的算法相結合。

如果有一個領域從這一發展中受益匪淺，那就是表徵學習。表示學習是監督學習的一部分，也稱為特徵學習。特徵學習在很多應用中直接取代了特徵工程。供您參考，特徵工程是一個處理開發描述符和特徵以執行其他機器學習任務的領域。

最好的例子之一是使用卷積神經網絡 (CNN) 進行對象檢測、圖像分類和實現高精度，從而為其他傳統算法設定了基準。 ImageNet 在 2012 年進行了一場比賽，並在很大程度上超越了基於特徵工程的 SOTA。

現在讓我們來了解具有相似起源和蓬勃發展的未來的領域，幾何深度學習。

幾何深度學習一詞最早由 Bronstein 等人提出。在他們 2017 年發表的文章中，文章的標題是“幾何深度學習：超越歐幾里得數據”。

這是一個強有力的標題，它告訴幾何深度學習即使在非歐幾里得數據上也能夠使用深度學習。非歐幾里得數據是一組無法放入二維空間的數據。

通常，在計算機圖形領域非常廣泛的圖形專業化或網格來可視化非歐幾里得數據。

左圖為測地線距離，右圖為歐式距離。上圖中的網格是一個人的臉。現在，通過網格，最短的表面距離是兩個地標之間的測地線距離。而使用直線計算的兩個地標之間的距離是歐幾里得距離。

測地線距離是以非歐幾里德形式表示任何網格的主要優勢，因為它對在其上執行的任務更為重要。並不是說我們天生就不能將非歐幾里得數據轉換成歐幾里得數據，但實際情況是，失去性能和效率的代價很高。

非歐幾里得數據的一個主要且重要的例子是圖表。圖是這樣一種數據結構，它由連接到關係或邊的實體或節點組成。圖表可用於對幾乎所有事物進行建模。

好吧，你不需要了解圖論，你只需要閱讀一點，這樣你就可以使用過程中需要的軟件庫。您應該對幾何深度學習有非常清晰的基本知識，以便對圖及其基本理論進行出色的介紹。

對於用於解決基於幾何深度學習的問題的數據，如果您已經根據需要處理的數據識別出可實現的實例，或者相反；那麼這是最好的情況。

閱讀：卷積神經網絡

統計推理

我們要了解的是歸納推理和演繹推理的區別。在演繹推理方面，一般術語用於得出特定結論或提出特定主張。讓我們結合這兩個斷言來形成一個例子。

“所有女孩在測試中得分 10/10”和“泰勒是個女孩”最終意味著“泰勒在測試中得分 10/10”。歸納推理反之亦然；在這裡，一般的想法或結論是從特定的術語中得出的。讓我們舉一個例子來形象化推理。回答這個問題：

哪頭奶牛隻生產長壽命 (UHT) 牛奶？如果你說“沒有”，那麼你就屬於 21% 的受訪青年。 5%的受訪青年標註“奶牛”，10%標註“全部”，2%排成“母牛”和“黑白奶牛”，50%沒有回答。

另請閱讀：循環神經網絡

從這個結果中有很多東西需要分析，但讓我們考慮一下米爾卡奶牛的想法。讓我們以青年的觀點來理解歸納推理形式的結論。首先，“奶牛是一個特殊的品種”，“UHT奶是特殊的”，最終導致“UHT奶是奶牛產的”。

我們可以從中總結出什麼？歸納偏差或歸納推理是學習者的一組假設，足以解釋其歸納和演繹干擾。在設計歸納偏置算法時必須非常小心。可以使用感應干擾來達到相當於演繹推理的結果。

有趣的事實：從更大的計算機科學中的數學語料庫來看，如果有任何學科被認為是一門很難的學科，那就是離散數學中的圖論。

然而，圖論允許我們執行一些令人興奮的任務，並通過深度學習提供驚人的見解。

圖分割是對圖的一個和所有組件（如節點（實體）、邊（關係））進行分類的過程。想想自動駕駛汽車，它們需要在定期間隔後對其環境進行監測，並預測行人接下來會做什麼。

通常，人類行人要么被表示為三維的巨大邊界框，要么被表示為更多程度的運動骨架。隨著更快更好的三維語義分割，自動駕駛汽車將擁有越來越多的算法，這使得感知變得可行。

在圖分類中，該算法獲取一個圖或子圖作為輸入，並解釋 n 個類別的一個輸出，這些類別指定具有與預測相結合的確定性值。它相當於所採用的網絡有兩個主要部分的圖像分類。

第一個重要部分是特徵提取器，它創建輸入數據的光學表示。然後為了將輸出回歸約束到一個特定的維度，使用了全連接層。另一方面，多類分類需要一個 softmax 層。

必讀：當今構建自己的人工智能係統的分步方法

我們通過將幾何深度學習放在整體深度學習環境中來深入理解幾何深度學習。我們可以得出結論，幾何深度學習將不規則數據作為一個整體來處理，並且我們通過說明圖在學習偏差中的作用是多麼有希望來了解圖。

如果您有興趣了解有關深度學習技術、機器學習的更多信息，請查看 IIIT-B 和 upGrad 的機器學習和人工智能 PG 文憑，該文憑專為在職專業人士設計，提供 450 多個小時的嚴格培訓、30 多個案例研究和任務、IIIT-B 校友身份、5 個以上實用的實踐頂點項目和頂級公司的工作協助。

機器學習和人工智能的 PG 文憑

了解更多