監督與無監督學習：監督和無監督學習之間的區別

已發表: 2020-11-30

介紹

機器學習大致分為三種類型，即監督學習、無監督學習和強化學習。強化學習仍然是新的並且正在快速發展，所以讓我們在本文中忽略它，深入研究監督和無監督學習。

在進入這兩種學習類型的實際定義和用法之前，讓我們先熟悉一下機器學習。機器學習是人工智能的一種應用，它為系統提供了自動學習和改進經驗而無需明確編程的能力，這只是機器學習的教科書定義，因為本文主要是為數據科學和人工智能領域的新手編寫的讓我讓你更清楚更有趣，以便你更好地理解和解釋它。

讓我們將嬰兒視為我們的機器，我們需要幫助嬰兒學習我們數字系統中的不同數字。為了幫助寶寶學習，我們需要給寶寶看一個不同的數字，並告訴他們每個數字是什麼。

反复做這部分可以幫助寶寶學習和記憶數字。這只不過是無需明確編程即可自動學習和改進經驗的能力，即機器學習。

閱讀：機器學習項目理念

讓我們從經典教科書對監督學習的定義重新開始，熟悉我們之前舉的嬰兒示例。監督學習是一項機器學習任務，它根據示例輸入-輸出對學習將輸入映射到輸出的函數。它從由一組訓練示例組成的標記訓練數據中推斷出一個函數。

我討厭任何教科書中寫的定義，因為它們太正式了，很難理解，我更喜歡朋友用他自己的想法來解釋定義。從長遠來看，每當我試圖回憶一個定義時，最終都會彈出一個朋友給出的示例解釋，讓我的生活更輕鬆。所以，在這篇文章中，讓我成為你的朋友。

讓我們再次以我們之前考慮的嬰兒為例，在這種情況下，我們需要讓嬰兒學習並識別我們擁有的不同水果。讓我們將蘋果和橙子視為我們的兩種水果，我們首先向寶寶展示這兩張照片。我們還告訴寶寶哪張圖片是哪種水果。

看著這些照片，寶寶知道水果是圓形的，紅色水果是蘋果，橙色水果是橙色。現在讓我們給寶寶看一張橘子的新照片，讓他找出這張照片是蘋果還是橘子。

寶寶預測水果是橙色的。寶寶正確地預測水果是橙子，因為我們將蘋果和橙子這兩種水果分為兩類，並要求寶寶學習什麼是什麼水果。如果我們用嬰兒代替機器，這就是監督機器學習的工作原理。

監督機器學習進一步分為兩類問題，稱為分類和回歸。

從名稱本身，我們可以知道這是一個機器學習問題，我們需要將給定的數據分類為兩個或更多類。我們採用的上述示例是一個分類問題，因為我們需要將給定的圖片分類為 Apple 或 Orange 類。

當我們只有兩個類來對我們的數據進行分類時，它被稱為二元分類。但在現實世界的數據中，我們往往有不止一個類，它被稱為多類分類。大多數人使用這些類型的學習來識別垃圾郵件，對客戶進行分類，檢查客戶是否從運營商那裡流失，以及更多用例。

另請閱讀：機器學習職業

另一方面，回歸處理的是連續數據，例如根據經驗預測你的薪水。在這種情況下，我們不需要將數據放入任何類中，而是需要根據我們擁有的連續數據來預測連續值。

這些類型的問題在其數據集中具有連續的列，而分類往往具有分類列。這些類型的學習用於預測任何公司下一季度的財務增長、基於他以前的分數的學生分數等等。

無監督學習是一種機器學習，它在沒有預先存在的標籤和最少人工監督的數據集中尋找以前未檢測到的模式。

與通常使用人工標記數據的監督學習相比，無監督學習（也稱為自組織）允許對輸入的概率密度進行建模。讓我們考慮嬰兒示例，以更好地理解無監督機器學習。

讓我們在這個例子中使用一組貓狗的圖片作為輸入，在前面的例子中，寶寶知道這些圖片是蘋果和橙子的，因為我們已經對它們進行了標記和分類。

在這種情況下，嬰兒什麼都不知道，因此無法區分哪一隻是貓，哪一隻是狗。但是可以看出，與其他幾張相比，很少有圖片看起來相似。在這種情況下，我們無法標記數據，但我們仍然可以在數據中找到模式。這就是無監督機器學習的工作原理。

上面的例子清楚地描述了聚類問題，我們需要根據我們在數據中找到的模式對數據集進行聚類。聚類是一個非常重要的機器學習問題，許多公司傾向於使用這種技術從他們的數據中找到有價值的模式和見解。

在這篇文章中，我們了解了不同類型的機器學習，通過一個易於理解的例子來了解那些，研究了每種學習的進一步劃分。本文僅涵蓋機器學習問題的基礎知識，每種類型的問題都有不同類型的機器學習算法。

如果您有興趣了解有關機器學習的更多信息，請查看 IIIT-B 和 upGrad 的機器學習和人工智能 PG 文憑，該文憑專為工作專業人士設計，提供 450 多個小時的嚴格培訓、30 多個案例研究和作業、IIIT- B 校友身份、5 個以上實用的實踐頂點項目和頂級公司的工作協助。

機器學習和人工智能的 PG 文憑

了解更多