ベイジアンニューラルネットワークとは何ですか? 背景、基本的な考え方と機能
公開: 2020-12-23目次
序章
この記事では、ベイジアンニューラルネットワークの基本的な概念について説明します。 ベイジアンニューラルネットワークのこの特定の概念は、目に見えないデータがニューラルネットワークに供給されるときに機能し、不確実性を生み出します。
ニューラルネットワークアーキテクチャにはない予測のこの不確実性の尺度は、ベイジアンニューラルネットが説明しているものです。 過剰適合に対処するだけでなく、不確実性の推定や確率分布などの追加機能にも役立ちます。 ニューラルネットワークの概念も説明されています。
読む:教師あり学習の種類
ベイジアンニューラルネットワークの背景
過去10年間で最高のパフォーマンスを発揮する人工知能システムの1つを比較すると、これらのマシンにはすべて共通点が1つあります。それは、ディープラーニングと呼ばれる高度な技術を組み込んだものです。
ディープラーニングの概念を切り開いてみると、約70年以上にわたって一貫性のない傾向にあるニューラルネットワークと呼ばれる、人工知能への比較的新しいアプローチを可能にした名前であることがわかります。 一例として、ニューラルネットの概念は、人間の脳に漠然と基づいていることが観察されます。人間の脳は、絡み合ったワイヤのように密なメッシュとして接続された数百万の処理ノードで構成されています。
したがって、ベイジアンニューラルネットワークは、そのように供給されるトレーニングデータの不確実性の問題に便利に対処します。

ベイジアンニューラルネットワークの基本的な考え方
より一般的にはニューラルネットとして知られているニューラルネットワークは、コンピューターがトレーニング例を分析することによってタスクを学習、分析、および実行する機械学習の効果的な方法です。 使用されている例は、ほとんどが事前に手作業でラベル付けされています。 たとえば、オブジェクト認識システムを考えてみましょう。
自動車、車、家、または任意のオブジェクトのラベル付き画像に関する情報が提供または提供されます。 次に、他の特定のラベルと一貫して相関するデータとして挿入された視覚パターンの論理的推論を定式化します。
ニューラルネットを使用するアーキテクトは、データからの非常に複雑な入力および出力マッピングの分解と学習で勝利を収めてきました。 それにもかかわらず、同じ入力と出力マッピングシステムの基本的な知識は、通常、特に特定のモデルの信念を統合する必要がある場合、またはデータが限られている状況では、ほとんどの状況を満たさないことになります。
ベイジアンニューラルネットワークは、ほとんどの状況で分布として表される基準またはパラメーターであり、決定論的値と比較して、通常はベイズ推定の概念を通じて学習されます。 それらには、データから複雑な非線形関数を消化し、不確実性を同時に表現する内部能力があります。 したがって、それはまた、より信頼性が高く有能なAIを獲得し、構築することを追求する上で、彼らをより高い役割に導きました。
必読:機械学習における回帰モデルの種類
ベイジアンニューラルネットワークとは何ですか?
したがって、ベイジアンニューラルネットワークは、以前の推論に関する標準ネットワークの拡張を指します。 ベイジアンニューラルネットワークは、不確実性が高く絶対的な特定の設定で非常に効果的であることが証明されています。 これらの状況は、つまり、意思決定システム、または比較的低いデータ設定、またはあらゆる種類のモデルベースの学習です。

ディープニューラルネットワーク(DNN)は、データセットの経験がなくても、特定のデータを使用して論理的な推論を作成する傾向があります。 結果として、それらは本質的に非線形であるデータで非常にうまく機能し、したがって、唯一のトレーニング目的のために大量のデータを必要とします。 より多くの情報がロードされるため、サーフェスの過剰適合の問題が発生します。
現在の状況で発生する問題は、以前に観察されたように、ニューラルネットは、トレーニングの唯一の目的で供給されるデータで非常にうまく機能しますが、新しいデータや外国のデータがシステムに供給されるとパフォーマンスが低下する傾向があることです。 これにより、ネットはトレーニングデータ自体の特定の不確実性を認識できなくなり、予測に自信がなくなり、誤解を招く可能性があります。 したがって、このようなエラーをなくすために、ベイジアンニューラルネットワークが使用されます。
ベイジアンニューラルネット(BNN)はどのように機能しますか?
ベイジアンニューラルネットワークの背後にある主な目的と考え方は、すべてのユニットが、重みとバイアスを含む確率分布に関連付けられているということです。
それらは確率変数として知られており、アクセスされるたびに完全に異なる値を提供します。
例を挙げると、Xが変数であり、完全に確率変数である場合、は正規分布を表します。 Xにアクセスするたびに、Xの発散値が与えられます。 Xの値が取得されるたびに発散する値を取得するプロセスは、サンプリングと呼ばれます。 すべてのサンプルから導出される値は、確率分布に依存します。

確率分布の範囲が広がると、不確実性は正比例します。 その結果、それも上昇します。 通常、ニューラルネットワークでは、すべての層に固定された重みがあり、バイアスは通常、出力を考慮します。 一方、ベイジアンネットワークには、レイヤー自体に接続される確率分布があります。
毎回複数のフォワードパスが実行され、新しい重みとバイアスのセットが使用されます。 したがって、分類の問題を処理するために使用されます。 出力は、順方向に行われたすべてのパスに対して提供されます。 入力画像としてアップロードされたデータは、不確実性を高める原因となります。 そのような場合、それは出力クラスのためにネットが以前に遭遇したことのないイメージです。
結論
ベイジアンニューラルネットワークは、不確実性の統合と対処に関しては祝福であると結論付けるのは安全です。 それらはまた、予測性能を改善するために現れました。
ベイジアンニューラルネットワークまたは確率に基づくモデルの開発で発生する主な基本的な問題は、以前の分布とそれぞれの期待の手に負えない計算です。 さらに、過剰適合の問題がベイジアンネットワークによって非常に確実に処理されていることは非常に明白です。
機械学習について詳しく知りたい場合は、IIIT-BとupGradの機械学習とAIのPGディプロマをご覧ください。これは、働く専門家向けに設計されており、450時間以上の厳格なトレーニング、30以上のケーススタディと課題、IIIT-を提供します。 B卒業生のステータス、5つ以上の実践的なキャップストーンプロジェクト、トップ企業との仕事の支援。
ベイジアンネットワークからグラフィカルモデルをどのように作成しますか?
各コンポーネントに関係するすべてのノードをリンクすることにより、ベイジアンネットワークを無向グラフィカルモデルに変えることができます。 これには、各ノードの親の参加が必要です。 モラルグラフは、特定のベイジアンネットワークに対応する無向グラフです。 モラルグラフの計算は、多くのベイジアンネットワーク計算手法の最初の段階です。
ベイジアンネットワークと確率の関係は何ですか?
ベイジアンネットワークは、非巡回有向グラフを使用して作成されます。 ベイジアンニューラルネットワークは、与えられたモデルの各変数に単一の条件付き確率分布を適用することによって因数分解される確率モデルです。 分布は、グラフの親に基づいています。 分離されたグラフ内の変数は依然として独立していますが、無向グラフの基本的なグラフ分離は、観測値の競合する説明の影響を考慮した、より困難なd分離に置き換えられます。
ベイジアンネットワークが行う仮定を1つ挙げてください。
ターゲット分類が提供される場合、単純ベイズ分類器の重要な仮定は、すべての変数値が条件付きで独立していることです。 この仮定は、事後確率の観点から目的関数の計算を単純化するのに大いに役立ちます。 ただし、テキストドキュメントや音声信号などの一部のアプリケーションでは、この仮定が正しくない場合があります。 このシナリオでは、ベイジアンビリーフネットワークが有用な選択となる可能性があります。 それらは、すべての変数にすべての可能な値を課すのではなく、条件付きで独立した確率のセットを採用します。