無監督機器學習如何工作?

已發表: 2018-06-13

無監督學習是指使用未分類或未標記的信息訓練 AI 系統。 理想情況下,這意味著算法必須在沒有任何事先指導的情況下對信息採取行動。
在無監督學習中,機器將關於異同的未排序/無序信息分組。 這是在沒有為機器提供分類數據的情況下完成的。 使用這種學習的系統通常與生成學習模型相關聯。

目錄

無監督機器學習如何工作?

在無監督學習中,人工智能係統呈現未標記、未分類的數據,系統的算法無需事先訓練即可對數據進行操作。 輸出取決於編碼算法。 對系統進行無監督學習是測試該系統能力的一種既定方法。
無監督學習算法可以執行比監督學習系統更複雜的處理任務。 然而,無監督學習可能比替代模型更難以預測。 例如,使用無監督模型訓練的系統可能會自行弄清楚如何區分貓和狗,它還可能會添加意外和不受歡迎的類別來處理不尋常的品種,這可能最終會弄亂東西而不是將它們留在命令。

對於無監督學習算法,AI 系統呈現一個未標記和未分類的數據集。 要記住的是,該系統沒有經過任何先前的培訓。 從本質上講,無監督學習可以被認為是沒有老師的學習。
在監督學習的情況下,系統既有輸入也有輸出。 因此,根據期望輸出和觀察到的輸出之間的差異,系統將被設置為學習和改進。 然而,在無監督學習的情況下,系統只有輸入,沒有輸出。
什麼是機器學習及其重要性

在與數據挖掘和特徵提取相關的任務中,無監督學習非常有用。 無監督學習的最終目標是發現數據中隱藏的趨勢和模式或提取所需的特徵。 就像我們之前說的,無監督學習只處理輸入數據集,沒有任何先驗知識或學習。 因此,有兩種類型的無監督學習:

參數無監督學習

參數無監督學習假設數據的參數分佈。 這意味著,這種類型的無監督學習假設數據來自一個基於某些參數遵循特定概率分佈的群體。 理論上,如果我們考慮一個對象族的正態分佈,那麼我們會看到所有成員都有一些相似的特徵,並且總是通過均值和標準差進行參數化。 這意味著,如果我們知道均值和標準差,並且分佈是正態的,那麼我們可以很容易地找出未來觀察的概率。 參數無監督學習比標準監督學習困難得多,因為沒有可用的標籤; 因此沒有預定義的準確度度量來測試輸出。

非參數無監督學習

非參數無監督學習是指輸入數據集的聚類。 從本質上講,每個集群都說明了集合中存在的數據項的類別和類別。 這是數據建模和分析小樣本數據最常用的方法。 這些方法也被稱為無分佈方法,因為與參數學習的情況不同,建模者不需要對整個人口的分佈做出任何假設。
這 6 種機器學習技術正在改善醫療保健

在這一點上,有必要深入了解一下我們所說的集群是什麼意思。

那麼,什麼是聚類?

當涉及到無監督學習時,聚類是最重要的基本概念之一。 它處理在未分類的數據集合中查找結構或模式。 集群的簡單定義可以是“將對象分組為類的過程,這樣類的每個成員都以一種或另一種方式與另一個相似。”
因此,集群可以簡單地定義為數據對象的集合,這些數據對像在一個集群之間“相似”,而與另一個集群的對象“不相似”。

無監督機器學習的應用

無監督機器學習的目標是發現數據中先前隱藏的模式和趨勢。 但是,在大多數情況下,數據模式與監督機器學習所能實現的效果並不一致——例如,它們將客戶分成大組,而不是將他們視為個人並提供高度個性化的通信。 在無監督學習的情況下,我們不知道結果會是什麼,因此,如果我們需要設計一個預測模型,監督學習在現實世界中更有意義。
使用無監督機器學習的理想用例是當您沒有關於預期結果的數據時。 例如,如果您需要確定全新產品的目標市場。 但是,如果您想更好地對您的消費者群進行分類,監督學習是更好的選擇。
5 機器學習的突破性應用

讓我們看一下無監督機器學習技術的一些應用:

  1. 無監督學習對於從數據集中進行異常檢測非常有幫助。 異常檢測是指在您的數據集合中找到重要的數據點。 這對於發現欺詐性交易、發現損壞的硬件或識別在數據輸入過程中可能潛入的任何異常值非常方便。
  2. 關聯挖掘意味著識別在數據集中一起出現的一組項目。 這對於籃子分析非常有用,因為它允許分析師發現經常一起購買的商品。 如果不對數據進行聚類,關聯挖掘是不可能的,當您談論聚類時,您談論的是無監督機器學習算法。
  3. 無監督學習的另一種用例是降維。 它指的是減少數據集中的特徵數量,從而實現更好的數據預處理。 潛在變量模型通常用於此目的,並且只有通過使用無監督學習算法才能實現。

使用無監督學習發現的模式和趨勢也可以在以後應用監督學習算法時派上用場——例如,無監督學習可以幫助您對數據集進行聚類分析,然後您可以在您選擇的任何聚類上使用監督學習/需要。
機器學習工程師:神話與現實

總而言之,機器學習和人工智能是非常複雜的領域,你遇到的任何復雜的人工智能係統很可能會使用各種學習算法和機制的組合。 話雖如此,如果您是初學者,則必須了解圍繞所有主要學習技術的關鍵點。

從世界頂級大學學習 ML 課程。 獲得碩士、Executive PGP 或高級證書課程以加快您的職業生涯。
我們希望我們能夠闡明無監督學習算法的細微之處。 如果您有任何疑問,請在下面的評論中留言!

提到無監督機器學習的一些限制。

在無監督機器學習的情況下,可能需要人工干預來掌握不同的模式並將它們與領域專業知識聯繫起來,這可能是昂貴的。 經常發現輸出或發現是不准確的。 無法精確定義無監督任務的排序和輸出。 它高度依賴於模型,因此也依賴於機器。 此外,課程總數未知。 因此,分析的結論難以驗證。

無監督機器學習中的關聯規則是什麼?

關聯規則是幾種無監督機器學習方法之一。 您可以使用關聯規則在大型數據庫中的數據元素之間創建關係。 發現海量數據庫中變量之間有趣的相關性是這種無監督方法/算法的目標。 關聯規則是一組方法,用於為生成各種預測和評估某些事件發生在其他事件之上的可能性提供一個很好的基礎。