Python 中的線性回歸實現:完整指南
已發表: 2019-11-18無論你是使用 Python 學習機器學習還是統計學,你都會遇到線性回歸。 線性回歸是機器學習認證課程的重要組成部分之一。
它是什麼? 如何使用 Python 執行線性回歸?
在本文中,我們將發現這些問題的答案。 閱讀本文後,您將熟悉:
- 回歸和它們是什麼
- 什麼是線性回歸
- 如何訓練線性回歸模型
- 線性回歸的應用
讓我們開始吧。
目錄
什麼是回歸?
回歸分析是指用於估計因變量和自變量之間關係的特定統計過程。
它在金融和銀行等多個行業中很受歡迎。 通過使用回歸分析,您可以了解特定環境中兩個變量之間的關係。

假設您要查找特定區域的房屋價格。 為此,您需要觀察該地區的城市、居民數量、便利設施的可用性以及許多其他信息。
房屋價格所依賴的東西稱為特徵。 而這些因素與每個家庭的成本相關的問題是一個觀察結果。 在此示例中,假設位置、便利設施和其他因素會影響每個房屋的價格。
簡而言之,您對回歸分析中的特定主題進行了一些觀察。 在你開始建立它們之間的關係之前,你的觀察有一些特徵和一些假設。
回歸分析中有兩種特徵。 他們是:
- 相關特徵,稱為相關輸出、變量或響應
- 獨立特徵,稱為獨立輸出、變量或響應
通常,回歸問題有一個連續的因變量。 輸入不同。
您可以用 y 表示輸出,用 x 表示輸入。 它沒有硬性規定,但通常使用 y 和 x 來表示這些輸出和輸入。
如果您有多個自變量,則可以表示為 x = (x1,…,xr),其中 r 表示輸入的數量。
從世界頂級大學在線獲取最佳機器學習課程——機器學習和人工智能領域的碩士、高級管理人員研究生課程和高級證書課程,以加快您的職業生涯。
什麼是線性回歸?
線性回歸是最流行的回歸類型。 它是一種統計方法,用於對依賴輸出和一組獨立輸出之間的關係進行建模。
在本文中,我們將獨立輸出稱為“特徵”,將依賴輸出稱為“響應”。
如果線性回歸只有一個特徵,則稱為單變量線性回歸。 同樣,如果它具有多個特徵,則稱為多元線性回歸。
線性回歸最顯著的優點是易於解釋其結果。 線性回歸面試題
這是最簡單的回歸形式。
假設
如果 y 是預測值,0 是偏差項,xn 和是特徵值,您可以通過以下等式表示線性回歸模型:
Y = 0 + 1 x 1 + 2 x 2 +…。 + n x n
這裡 n 表示模型參數。
線性回歸 Python 代碼
要創建線性回歸模型,您還需要一個數據集。 有多種方法可以使用 Python 代碼進行線性回歸。
我們建議您在開始這方面的工作之前學習 Python 並熟悉 Python 庫。
它可以幫助您創建基本的線性回歸模型。
訓練回歸模型
您必須找到模型的必要參數,以便它最適合數據。 您必須找到最佳擬合線(或回歸線)。

回歸線是觀測數據和預測數據之間的誤差最小的一條。 這些錯誤的另一個名稱是殘差。
為了測量誤差,您必須定義成本函數:
J ( ) = 1 2m i=1 m (h( x i ) – y i ) 2
這裡,h(x) 代表假設函數,由我們之前討論的方程表示:
h(x) = 0 + 1 x 1 + 2 x 2 +…。 +我x我
m 代表我們數據集中的示例總數。
使用這些方程和優化算法,您可以訓練您的線性回歸模型。
還有許多其他執行 Python 回歸分析的方法,我們將在下面討論:
使用 Python 包執行線性回歸
您可以使用 NumPy,它是一個廣泛使用的基礎 Python 包。 它用於執行高性能操作。 它是開源的,並且有許多可用的數學例程。
您可以查看 NumPy 用戶指南以了解有關它的更多信息。 您還需要了解 scikit-learn,這是一個基於 NumPy 的流行 Python 庫。 它廣泛用於機器學習和類似活動。
為了開發線性回歸模型並實現它們,您還應該了解 statsmodels。 它是另一個強大的 Python 包,用於執行測試和估計統計模型。
線性回歸的應用有哪些?
線性回歸可用於許多行業。 以下是線性回歸的一些應用:
1) 了解趨勢
線性回歸可以幫助公司了解市場趨勢。 這樣,他們可以更好地規劃他們的策略並避免犯錯誤。 除了公司、交易者以及研究機構,也可以使用這種技術來評估趨勢。
2) 分析價格變化
商品的價格變化會對農產品企業的利潤產生重大影響。 線性回歸也可以幫助公司完成這項任務,因為他們可以找到價格變化與促成價格變化的因素之間的關係。

3) 風險評估
保險公司以及投資者可以使用線性回歸來找出異常情況。 投資者可以在降低風險的同時找到他們的弱投資並相應地制定策略。
結論性想法
線性回歸是重要的 AI 算法之一,我們希望您發現本 Python 線性回歸指南對您有用。 Python 回歸對於初學者來說可能是相當艱鉅的。 這就是為什麼我們建議首先熟悉 Python 包和算法。
如果您有興趣了解有關機器學習的更多信息,請查看 IIIT-B 和 upGrad 的機器學習和 AI 執行 PG 計劃,該計劃專為工作專業人士設計,提供 450 多個小時的嚴格培訓、30 多個案例研究和作業、IIIT -B 校友身份,5 個以上實用的實踐頂點項目和頂級公司的工作協助。
僅了解這兩個將使您在實施線性回歸時受益匪淺。
我們什麼時候使用回歸?
當一個問題中存在多個變量時,我們可能想了解所有變量之間的關係。 我們可以使用矩陣來找出特定變量對之間的潛在關係。 使用相關方法,我們可以測量任何一對變量之間的線性關係。 但是,當我們想要找出涉及多個變量的複雜關係時,這種方法是不夠的。 在這種情況下,回歸是理解多個變量之間複雜關聯的更有效方法。 回歸有助於我們了解哪些變量會影響特定的反應,以及這些變量如何解釋特定的結果。
機器學習中使用了多少種回歸?
回歸是一種技術,通過它我們可以預測目標變量和一個或幾個獨立預測變量之間的未來結果。 回歸在機器學習中非常常用,用於時間序列建模、預測和理解不同變量之間的因果關係。 機器學習中使用的不同類型的回歸是線性回歸、邏輯回歸、嶺回歸、多項式回歸和套索回歸。 您可以遇到機器學習中使用的更多類型的回歸分析方法。 然而,這些是所有其他方法中使用最廣泛的方法。
使用 Python 有什麼好處?
Python 是機器學習中最常用的編程語言之一。 它有幾個優點。 首先,Python 的語法很簡單。 它易於學習和理解,這使得它在初學者和經驗豐富的程序員中都非常流行。 其次,它是開源的,可以免費使用,並擁有一個由活躍的開發人員和研究人員組成的龐大社區。 Python內核內置的豐富函數庫為開發者提供了全面的支持,因此無需依賴外部或第三方庫。 此外,與 C 和 C++ 等其他一些編程語言不同,Python 具有高度的靈活性和系統獨立性。