幾何学的ディープラーニングとは何ですか?
公開: 2020-12-22リカレントニューラルネットワーク(RNN)や畳み込みニューラルネットワーク(CNN)などの深層学習アルゴリズムは、過去数年間で、音声認識、コンピュータービジョンなど、さまざまな分野の問題を解決する上で重要な役割を果たしてきました。 結果は非常に正確でしたが、ほとんどがユークリッドデータで機能しました。
しかし、ネットワークサイエンス、物理学、生物学、コンピューターグラフィックス、およびレコメンダーシステムに関しては、非ユークリッドデータ、つまり多様体とグラフを処理する必要があります。 Geometric Deep Learningは、この非ユークリッドデータを、多様体またはグラフ構造のデータに対する全体としての深層学習手法の感覚で処理します。
目次
幾何学的ディープラーニングとは何ですか?
過去数年間で、深層学習と機械学習の分野で大きな進歩が見られました。 コンピュータの能力は急速に成長しており、利用可能なデータは、1980年から1990年に新しいアプリケーション用に開発されたアルゴリズムと組み合わされています。
この開発から多くの恩恵を受けた分野があるとすれば、表現学習でしょう。 表現学習は教師あり学習の一部であり、特徴学習とも呼ばれます。 特徴学習は、多くのアプリケーションで特徴工学に直接取って代わります。 参考までに、特徴エンジニアリングは、他の機械学習タスクで実行するための記述子と機能の開発を扱う分野です。
最良の例の1つは、畳み込みニューラルネットワーク(CNN)を使用してオブジェクトを検出し、画像を分類し、高い精度を実現することで、他の従来のアルゴリズムのベンチマークを設定することです。 ImageNetは2012年に競争を実施し、特徴工学に基づいてSOTAを大幅に上回りました。
ここで、同様の起源と開花する未来、幾何学的な深層学習を持つ分野を理解しましょう。

幾何学的深層学習という用語は、Bronsteinetalによって最初に呼ばれました。 2017年に公開された彼らの記事では、記事のタイトルは「幾何学的深層学習:ユークリッドデータを超えて」でした。
これは、幾何学的深層学習が非ユークリッドデータでも深層学習を採用できることを示す強力なタイトルです。 非ユークリッドデータは、2次元空間に収まらないデータのセットです。
通常、非ユークリッドデータを視覚化するためのグラフィックスペシャライゼーションまたはコンピュータグラフィックス分野で非常に広範なメッシュ。
左側の図は測地線距離を示し、右側の図はユークリッド距離を示しています。 上図のメッシュは人の顔です。 ここで、メッシュ全体で、最短のサーフェス距離は2つのランドマーク間の測地線距離です。 一方、直線を使用して2つのランドマーク間で計算された距離は、ユークリッド距離です。
測地線距離は、メッシュに対して実行されるタスクにとってより重要であるため、非ユークリッド形式でメッシュを表すことの主な利点です。 非ユークリッドデータを本質的にユークリッドデータにキャストできないわけではありませんが、パフォーマンスと効率を失うことには高いコストがかかります。
非ユークリッドデータの主要で重要な例はグラフです。 グラフは、リレーションシップまたはエッジに接続されているエンティティまたはノードで構成されるデータ構造です。 グラフは、ほぼすべてのものをモデル化するために使用できます。
さて、あなたはグラフ理論を理解する必要はありません、あなたはプロセスで必要とされるソフトウェアライブラリを使うことができるようにそれを少し読む必要があります。 グラフとその基本理論の優れた入門書として、幾何学的ディープラーニングの明確な基本知識が必要です。
幾何学的深層学習に基づいて問題を解決するために使用されるデータについて、破棄する必要のあるデータに基づいて達成可能なインスタンスをすでに認識している場合、またはその逆。 次に、それは最良のシナリオです。
読む:畳み込みニューラルネットワーク

統計的推論
私たちが理解したいのは、帰納的推論と演繹的推論の違いです。 演繹的推論に関しては、一般的な用語は、特定の結論に達するため、または特定の主張をするために使用されます。 これらのアサーションの両方を組み合わせて例を作成しましょう。
「すべての女の子がテストで10/10を獲得しました」、「テイラーは女の子です」は、最終的に「テイラーがテストで10/10を獲得した」ことを意味します。 帰納的推論はその逆です。 ここでは、一般的なアイデアまたは結論が特定の用語から導き出されます。 例を挙げて、推論を視覚化してみましょう。 この質問に答えてください:
どの牛が長寿命(UHT)牛乳しか産出しないのですか? 「なし」と言えば、あなたはインタビューを受けた若者の21%に含まれています。 インタビューを受けた若者の5%が「ミルカ牛」、10%が「すべて」、2%が「雌牛」と「白黒牛」と並んでおり、50%が無回答でした。
また読む:リカレントニューラルネットワーク
この結果から分析すべきことはたくさんありますが、ミルカ牛の考えを考えてみましょう。 若者の視点で帰納的推論の形で結論を理解しましょう。 まず、「ミルカ牛は特別な品種です」、「UHT牛乳は特別です」、それが最終的に「UHT牛乳はミルカ牛によって生産される」につながります。
これから何を要約できますか? 帰納的バイアスまたは帰納的推論は、学習者の一連の仮定であり、帰納的および演繹的干渉を説明するのに十分です。 誘導バイアスのアルゴリズムを設計する際には、非常に注意する必要があります。 帰納的推論を使用して、演繹的推論と同等の結果を得ることができます。
興味深い事実:より大きなコンピュータサイエンスの数学コーパスから、難しい主題として考えられていると言われている主題がある場合は、離散数学のグラフ理論です。
ただし、グラフ理論を使用すると、いくつかのエキサイティングなタスクを実行し、ディープラーニングで驚くべき洞察を得ることができます。
グラフのセグメンテーション
グラフのセグメンテーションは、ノード(エンティティ)、エッジ(関係)など、グラフの1つおよびすべてのコンポーネントを分類するプロセスです。 定期的に環境を監視し、歩行者が次に何をするかを予測する必要がある自動運転車について考えてみてください。
通常、人間の歩行者は、3次元の巨大な境界ボックスとして、またはより高度なモーションスケルトンとして表されます。 より速く、より優れた3次元セマンティックセグメンテーションにより、自動運転車は、知覚を実現可能にするアルゴリズムをますます多く持つようになります。

グラフの分類
グラフ分類では、アルゴリズムはグラフまたはサブグラフを入力として取得し、予測と組み合わせた確実性の値を持つように指定されたn個のクラスの1つの出力を解釈します。 これは、採用されたネットワークが2つの主要部分からなる画像分類に相当します。
最初の重要な部分は、入力データの光学的表現を作成する特徴抽出器です。 次に、出力回帰を特定の次元に制限するために、完全に接続されたレイヤーが使用されます。 一方、マルチクラス分類にはソフトマックス層が必要です。
必読:今日、独自のAIシステムを構築するためのステップバイステップの方法
結論
幾何学的ディープラーニングを全体的にディープラーニングのコンテキストに配置することで、幾何学的ディープラーニングを深く理解しました。 幾何学的深層学習は全体として不規則なデータを扱っていると結論付けることができ、学習バイアスにおけるグラフの役割がどれほど有望であるかを示すことによってグラフについて学びました。
ディープラーニングの手法、機械学習について詳しく知りたい場合は、IIIT-BとupGradの機械学習とAIのPGディプロマをご覧ください。これは、働く専門家向けに設計されており、450時間以上の厳格なトレーニング、30以上のケーススタディを提供しています。課題、IIIT-B卒業生のステータス、5つ以上の実践的なキャップストーンプロジェクト、トップ企業との仕事の支援。