使用回歸分析進行房地產估值 - 教程

已發表: 2022-03-11

執行摘要

回歸分析為房地產估值提供了更科學的方法

傳統上，評估財產有三種方法：可比銷售額、收入和成本。
回歸模型提供了一種更靈活、更客觀的替代方案。這也是一個過程，一旦模型被製作出來，就會變得自主，讓房地產企業家專注於他們的核心競爭力。
可以使用許多變量構建模型，這些變量會測試對房產價值的影響，例如平方英尺和臥室數量。
回歸不是靈丹妙藥。總是存在變量包含自相關和/或多重共線性的危險，或者變量之間的相關性是虛假的。

示例：為賓夕法尼亞州阿勒格尼縣建立回歸估值模型

可以通過電子方式訪問大量房地產信息以輸入模型。政府機構、專業數據提供商和多重上市服務是三個這樣的來源。
初始數據轉儲需要進行一些清理以確保沒有不規則的信息集。例如，在我們的樣本中，作為禮物轉讓的房屋被移除，以免扭曲公平市場價值的結果。
使用來自 10% 數據的隨機樣本，SPSS 返回以下五個變量作為對房地產價值的最預測性：
- 基於施工質量的等級排名 1-19（1=非常差，19=優秀）
- 成品生活區
- 空調（是/否）
- 批量
- 身體狀況或維修狀態等級 1-8 級
測試結果至關重要，Durbin-Watson 檢驗用於自相關，Breusch-Pagan 檢驗用於異方差性。在我們的模型中，存在輕微的異方差趨勢，這表明某些變量的可變性在整個值範圍內是不相等的。

基於回歸的房地產分析對您的業務有用嗎？

除了評估房產外，房地產中的回歸分析在其他領域可能特別有益：
- 測試過去交易的回報表現
- 定價和租金的定價分析
- 住宅買家和租戶的人口統計和心理分析
- 確定直銷目標
- 營銷活動的投資回報率分析
此外，在評估候選人以建立回歸模型時，要警惕那些從一開始就承諾世界的人。建立一個穩健的回歸模型是一個迭代過程，因此請關注那些天生好奇並能當場思考的人（即可以用思考過程回答腦筋急轉彎）。

在房地產領域，估值過程往往會被視為一種高調的吸拇指練習。房地產經紀人會過來，踢眾所周知的輪胎，然後用很少的“定量”洞察力產生一個估計值。考慮到對於許多人來說，房子將是一生中最大的金融投資，擁有房產所帶來的情感依戀可能會加劇這一過程。

然而，有一種方法可以解決這種瘋狂。好吧，準確地說是三個。

財產如何估價？

可比銷售方法在住宅房地產中最為常見，並使用類似物業的近期銷售來確定標的物業的價值。 “comps”的銷售價格根據它們與標的財產之間的差異進行調整。例如，如果可比物業有一個額外的浴室，則從其觀察到的銷售價格中減去浴室的估計價值。

商業地產被認為更加異質，因此可比銷售方法的使用頻率較低。收益法基於資產的內在價值等於其所有貼現現金流的總和這一概念，更常用於兩種方法：

與年金的現值類似，直接資本化方法使用財產的淨營業收入 (NOI) 除以“上限率”來確定價值。上限利率包含隱含的折現率和淨營業收入的未來增長率。
現金流量折現法提供了未來現金流量在一定時期內的現值，其終值是使用終端上限利率估計的。

最後一種技術是成本法，它根據獲得相同土地和建造標的財產複製品的成本來估算價值。然後根據標的財產的過時狀態對項目成本進行折舊。與可比銷售法的調整類似，目標是與標的財產緊密匹配。與其他兩種方法相比，成本方法的使用頻率較低。

由於用於估值的輸入的選擇，所有傳統的房地產估值方法都是主觀的。例如，上限利率的選擇對房產估值有重大影響：在對 NOI 為 100 萬美元的房產進行估值時，上限利率增加 4%（從 6% 到 10%）將降低40% 的財產（下圖）。

在房地產估值中使用回歸模型的好處

使用回歸模型進行房地產估值有很多好處。零售業已將其用於選址，但房地產業在很大程度上忽略了其潛在優勢。回歸分析特別適用於分析大量數據。對全國每個地方的房地產市場都有深入的了解幾乎是不可能的，但回歸模型可以幫助縮小搜索範圍。

1. 靈活性

使用回歸建模的最大好處是其固有的靈活性——它們可以獨立於其他模型或與其他模型協同工作。

最直接的方法是使用現有的銷售數據來預測主題屬性的價值，作為模型的輸出。有許多來自地方、州和聯邦機構的免費數據來源，可以通過私人數據提供者進行補充。

另一種選擇是使用回歸模型來更準確地預測其他傳統估值方法的輸入。例如，在分析混合用途商業項目時，開發商可以建立一個模型來預測零售空間每平方英尺的銷售額，並建立另一個模型來預測住宅部分的租金。然後，這兩者都可以用作收入法估值的輸入。

2. 客觀的方法

使用健全的統計原則可以產生更客觀的估值方法。這是避免確認偏見的最佳方法之一，當人們尋找能夠證實他們先前觀點的信息或拒絕與之相矛盾的新信息時，就會出現這種情況。當我為零售商建立模型來預測新店銷售時，他們常常驚訝地發現許多零售商受益於靠近競爭對手。事實上，與通常是他們最大競爭對手的沃爾瑪的託管是我的模型中最常用的變量之一。依賴現有的偏見可能會導致錯失機會，甚至更糟糕的是，將災難隱藏在拐角處。

統計估值的一些客觀優勢如下：

統計分析允許您確定模型中各個因素的統計顯著性（可靠性）。
雖然情景分析或敏感性分析可以讓您大致了解在更傳統的方法中對輸入的更改，但它更像是做出多個預測，而不是讓您更好地了解原始預測的準確性。另一方面，在構建回歸模型時，您將知道基於一定置信水平的結果範圍。

回歸模型的獨特之處在於它們具有內置的準確性檢查。在總體樣本上構建模型後，您可以使用樣本外數據上的模型來檢測可能的抽樣偏差。

3. 堅持你的核心競爭力

傳統的估值方法都存在很大的選擇偏差風險。在選擇可比較的屬性時，很容易陷入選擇最佳結果並假設它們最像您的項目的陷阱。還強調預測變量，例如收入方法中的回報率。消除對這一預測的需求可能對許多房地產投資者俱有吸引力，這就是為什麼基於回歸的估值是一種有用的方法。

回歸分析的潛在問題

引用不同百分比的統計數據的笑話數量本身就是一個笑話。我們幾乎每天都被媒體頭條轟炸，報導一項新研究的結果，其中許多似乎與去年發表的一項研究相矛盾。在一個充滿聲音的世界裡，沒有時間討論研究人員採用的方法的嚴謹性。

回歸分析的類型很多，但最常見的是線性回歸。有一些關於線性回歸的假設不應被違反以認為模型有效。違反這些假設會扭曲統計測試，以計算輸入和整體模型的預測能力。

線性回歸假設

輸入（自變量）和輸出（因變量）之間應該存在線性關係。例如，我們可以假設家中加熱的平方英尺與其總價值之間存在線性關係。然而，由於收益遞減，我們可以發現這種關係是非線性的，需要對原始數據進行轉換。

自變量不應該是隨機的。簡而言之，模型中每個自變量的觀測值是固定的，並假設它們的測量沒有誤差。例如，如果我們使用單元數來模擬一棟公寓樓的價值，那麼無論我們如何構建模型，樣本數據中的所有建築物都將具有不會改變的固定單元數。

模型的“殘差”（即模型的預測結果與實際觀察結果之間的差異）總和為 0，或者更簡單地說：我們將使用的模型將代表最佳擬合線。

該模型應該對每個自變量的所有觀察結果都是準確的。如果我們根據房屋的平方英尺來預測房屋的價值，如果該模型在預測 1,500 平方英尺以下房屋的價值時非常準確，我們將不希望使用該模型，但對於超過 3,000 平方英尺的房屋，則存在大量誤差平方英尺。這被稱為異方差。

在研究房地產行業時，線性回歸最常見的問題之一是觀測值之間殘差的相關性。您可以將其視為沒有模式的白噪聲。但是，如果殘差有規律，那麼我們很可能需要進行調整。這個問題很難概念化，但房地產行業主要關注兩個領域。

1. 自相關

基於長期觀察建立模型不適合預測當前值。假設我們建立了一個模型來使用平均房價作為自變量來預測酒店物業的價值。這個變量的預測能力可能會產生誤導，因為房價會隨著時間的推移而持續上漲。用統計術語來說，觀察到的平均房價之間存在自相關，隨著時間的推移呈現出積極的趨勢（即通貨膨脹），這在模型中沒有考慮到。住宅房地產中最廣泛使用的傳統可比銷售方法通過僅使用最新數據消除了這個問題。由於商業交易的數量要少得多，這種時間限制通常會使可比銷售方法無效。然而，有一些使用線性回歸的技術可以克服自相關的問題。

集群效應也是房地產估值建模的一項重大挑戰。這可以被認為是空間自相關。考慮這個問題的最簡單方法是想像構建一個模型來預測高速公路兩側兩個社區（A 和 B）的房屋價值。總體而言，該模型在預測值方面可能工作得很好，但是當我們檢查殘差時，我們注意到存在一種模式。 A區的房子一般被高估10%左右，B區的房子被低估了10%左右。為了改進我們的模型，我們需要考慮這種集群效應或為每個鄰域建立一個模型。

2.多重共線性

理想情況下，模型中的變量不會相互關聯。這個已知的問題稱為多重共線性。使用平方英尺和停車位數量作為評估區域購物中心的模型的輸入可能會證明多重共線性。這是直觀的，因為規劃代碼通常需要基於商業空間的平方英尺的一定數量的停車位。在此示例中，刪除其中一個變量將對調整後的模型進行更準確的評估，而不會顯著降低其預測能力。

其他注意事項

使用觀察到的數據是任何經驗方法的核心，但重要的是要記住過去的結果並不總能預測未來。房地產等非流動資產特別容易受到商業周期變化的影響。某些變量的預測能力可能會根據當前的經濟狀況發生變化。這個問題不是線性回歸所獨有的，在傳統方法中也存在。

相關不等於因果。模型構建的目的是找到可以做出有效預測的有用變量。你必須警惕虛假的相關性。您可能會驚訝地發現，緬因州的離婚率與人均人造黃油消費量之間存在極強的相關性。但是，如果您試圖預測未來的人造黃油銷售量，那麼使用緬因州的離婚數據將毫無意義。

通過回歸進行房地產估值的真實示例

現在讓我們實際應用這些知識，並從頭到尾構建一個線性模型。對於我們的示例，我們將嘗試建立一個房地產估值模型來預測賓夕法尼亞州阿勒格尼縣單戶獨立住宅的價值。阿勒格尼縣的選擇是任意的，所展示的校長適用於任何地點。我們將使用 Excel 和 SPSS，這是一種常用的統計軟件。

查找數據

找到高質量的數據是建立準確模型的第一步，也許是最重要的一步。儘管我們都聽說過“垃圾進，垃圾出”這句話，但重要的是要記住沒有完美的數據集。只要我們可以輕鬆地假設樣本數據代表整個人口，這很好。房地產數據的三個主要來源：

第一個也是最好的數據來源來自政府機構。這些數據中的大部分要么是免費的，要么成本相對較低。許多公司會向您收取您可以輕鬆免費獲得的數據的費用，因此在購買數據之前，請務必快速瀏覽一下互聯網。網絡搜索通常會通過搜索您要查找的縣或市以及“稅務評估員”、“稅務評估”、“房地產記錄”或“契約搜索”等詞來產生結果。地理信息系統 (GIS) 部門是許多社區中最容易被忽視的部分之一。他們通常擁有從其他各種當地機構匯總的大量數據。作為一名房地產開發商，我經常依靠他們的幫助來找到我用來構建模型的高質量數據，以幫助定位新的開發物業。經濟發展組織也可以成為很好的數據來源。
營利性供應商是另一種選擇。當您要跨多個區域查找數據時，它們特別有用。在為他們的數據支付大筆資金之前，請務必做好功課。不要只依賴他們的樣本數據集，因為它可能會在完整性方面產生誤導。如果您對他們有哪些可用數據有疑問，請直接與代表聯繫或詢問退款保證。
最後，本地多重上市服務 (MLS) 是一種寶貴的資源。大多數房產都是通過作為 MLS 成員的房地產經紀人銷售的。通常，MLS 的成員需要將其所有列表放入本地系統。不幸的是，加入 MLS 通常有很多限制，而且數據訪問的成本可能相當高。確保您在使用他們的數據時不違反服務條款並承擔潛在責任也很重要。

我們將專門使用來自賓夕法尼亞州西部地區數據中心和美國人口普查局的免費數據作為示例。 Alleghany 房地產銷售數據將為我們的觀察提供一個基礎文件，其中銷售價格作為我們的因變量（Y 變量）。我們還將使用每個人口普查區的步行分數和稅收評估信息來測試變量。

在構建房地產模型時，一個非常有用的變量是每個地址的緯度和經度。您可以通過地理編碼器獲取此數據，該地理編碼器使用街道地址來分配緯度和經度。美國人口普查局地理編碼器還將確定每個地點的人口普查區域，該區域通常用於匯總人口統計和心理信息。

分析、轉換和創建新變量。

現在我們已經選擇了數據源，我們需要檢查數據的質量。檢查數據質量的最簡單方法是為幾個關鍵變量運行頻率表。如果有大量丟失或損壞的條目，我們將需要進一步檢查數據。下表顯示，216,498 條記錄中只有 1 條在銷售文件中缺少郵政編碼，並且沒有錯誤的郵政編碼，如 99999 或 1X#45。這可能表明這是一個高質量的數據集。

數據字典在可用時是一種極好的資源。它將描述每個變量正在測量的內容，以及變量的可能選項。我們的數據包含對該縣進行的每筆銷售的分析。這是關鍵信息，尤其是在處理原始契約記錄時。所有房地產交易都必須記錄在案，才能依法強制執行，但並非所有轉讓都反映了房產的真實公平市場價值。例如，兩個家庭成員之間的銷售可能會以低於市場價格的價格作為一種禮物形式，或者是為了避免支付更高的交易成本，如契約印章。對我們來說幸運的是，當地政府明確標記了他們認為不能代表當前市場價值的轉讓，因此我們只會使用反映“有效銷售”的記錄。這些銷售額僅佔交易總數的 18% 左右，說明在開始使用數據進行分析之前了解數據的重要性。根據我的經驗，在分析契約記錄時，這個比率很常見。如果我們建立一個包含“無效銷售”的模型，我們的最終結果很可能會被扭曲。

接下來，我們會將評估數據和步行分數附加到銷售文件中。這為我們提供了一個用於模型的表。此時，我們需要對變量進行分析，看看它們是否適合線性回歸。下表顯示了各種類型的變量。

我們的文件包含幾個標稱值，例如街區或郵政編碼，它們對數據進行分類，沒有順序感。標稱值不適用於沒有變換的線性回歸。還有幾個序數變量對建築質量、財產的當前狀況等進行分級。只有當我們可以合理地假設每個等級間隔均勻時，才適合使用序數數據。例如，我們的數據有一個包含 19 個不同分類（A+、A、A- 等）的等級變量，因此我們可以安全地假設這些等級可能是均勻分佈的。

在我們可以在模型中使用它們之前，還需要轉換幾個變量。一個可以轉換為虛擬變量進行測試的標稱值是加熱和冷卻變量。我們將為所有沒有空調的屬性和有空調的屬性設置變量為 0 為 1。此外，字母等級需要轉換為數字（例如，0=最差，1=更好，2=最好）才能看到如果與價格成線性關係。

最後，我們需要確定是否適合使用所有觀察結果。我們想要預測單戶獨立屋的價值，因此我們可以從數據中剔除所有商業地產、公寓和聯排別墅。我們還希望避免自相關的潛在問題，因此我們僅使用 2017 年的銷售數據來限制這種情況發生的可能性。在我們消除了所有無關的記錄之後，我們就有了要測試的最終數據集。

樣本和變量選擇

選擇正確的樣本量可能很棘手。在學術材料中，建議的最小數字範圍很廣，經驗法則也多種多樣。對於我們的研究，總體人口相當大，因此我們不必擔心樣本數量是否足夠。相反，我們冒著樣本如此之大以至於幾乎每個變量在模型中都具有統計意義的風險。最終，隨機選擇了大約 10% 的記錄進行建模。

如果沒有統計軟件，變量選擇可能是該過程中最困難的部分之一。然而，SPSS 允許我們從我們認為適合線性回歸的變量組合中快速構建許多模型。 SPSS 將根據我們的統計顯著性閾值自動過濾掉變量，並僅返回最佳模型。

建立模型並審查結果

從我們的樣本數據中，SPSS 產生了五個模型。最具預測性的模型包括以下 5 個變量。

基於施工質量的等級排名 1-19（1=非常差，19=優秀）
成品生活區
空調（是/否）
批量
身體狀況或維修狀態等級 1-8 級（1=不適合居住，8=優秀）

讓我們看一下 SPSS 的結果。我們最初的主要關注點是 R 平方值，它告訴我們回歸預測因變量（價格）的方差百分比。最好的可能值是 1，我們模型的結果很有希望。衡量模型精度的估計標準誤差看起來相當高，為 73,091 美元。但是，如果我們將其與模型中銷售價格的標準差（160,429 美元）進行比較，錯誤似乎是合理的。

Model 5 具有可接受的標準誤差並通過了 Durbin-Watson 測試

SPSS 具有使用 Durbin-Watson 測試來測試自相關的內置功能。理想情況下，該值將是 0 到 4 範圍內的 2.0，但 1.652 的值不應引起警報。

接下來，我們測試模型的結果以確定是否有任何異方差的證據。 SPSS 沒有內置功能，但使用 Ahmad Daryanto 編寫的這個宏，我們可以使用 Breusch-Pagan 和 Koenker 測試。這些檢驗表明，我們的模型中存在異方差性，因為下圖中的顯著性水平 (Sig) 低於 0.005。我們的模型違反了線性回歸的經典假設之一。很可能需要轉換模型中的變量之一以消除問題。但是，在我們這樣做之前，最好先看看異方差性對我們自變量的預測能力的影響。通過使用 Andrew F. Hayes 開發的宏，我們可以查看自變量的調整後標準誤和顯著性水平。

模型中存在異方差，但進一步的測試表明它不影響自變量

進一步的測試表明，在考慮了模型中的異方差性之後，自變量仍然具有統計顯著性，因此我們現在不必改變它。

測試和優化模型

作為最終測試，我們將使用我們的模型對不屬於原始樣本的所有銷售記錄進行評分。這將幫助我們了解模型如何在更大的數據集上執行。該測試的結果表明，估計的 R 平方值和標準誤差在大數據集上沒有顯著變化，這可能表明我們的模型將按預期執行。

將模型應用於完整數據集顯示與樣本的一致性，觀察到相似的 R 平方和標準誤差值

如果我們想在現實生活中使用我們的示例模型，我們可能會進一步分割數據以獲得更精確的幾個模型，或者尋找額外的數據來提高這個單一模型的精度。這些步驟也可能會消除我們在模型中看到的異方差性。基於我們試圖使用單一模型來預測一個人口超過 100 萬的縣的房屋價值這一事實，我們無法在短短幾個小時內構建出“完美”的模型也就不足為奇了.

結論

我們的目標是建立一個模型來預測單戶獨立屋的價值。我們的分析表明，我們以合理的精度實現了這一目標，但我們的模型有意義嗎？

如果我們要描述我們的模型，我們會說房子的價值取決於地塊的大小、房子的平方英尺、建築的質量、目前的維修狀態，以及它是否有空調。這似乎很合理。事實上，如果我們將我們的模型與傳統的估值方法進行比較，我們會發現它與成本法非常相似，後者增加了獲取土地和建造新建築物的成本，並根據當前的過時狀態進行了調整。然而，用回歸短語來說，這種相似性可能是一種虛假的相關性。

由於在確定舊物業折舊的適當方法方面存在問題，通常僅建議使用成本法來評估新物業。使用我們的模型，我們創建了一個適用於任何年齡的房產的類似策略，事實上，我們已經將年齡作為一個獨立變量進行了測試，並得出結論，它對房產價值沒有統計學上的顯著影響！

為您的業務使用回歸分析

希望到現在為止，您對回歸分析的基礎知識有了更好的理解。下一個問題是：它可以幫助您的業務嗎？如果您對這些問題中的任何一個回答是肯定的，那麼您可能會從使用回歸分析作為工具中受益。

您想要更科學的方法來確定價值、進行預測或分析特定市場嗎？
您是否正在尋找更好的方法來識別大面積、區域甚至全國的潛在房地產投資？
您的目標是為您的商業房地產項目吸引大型零售商、餐館或酒店公司嗎？
您是否認為通過將新數據點整合到流程中可以潛在地改善您的決策過程？
您是否擔心為買家和投資者在營銷方面的投資回報？

上面的示例模型簡單地展示了在房地產中使用回歸建模的價值。收集數據和構建模型所花費的 2-3 小時遠未發揮其全部潛力。在實踐中，除了房地產估值之外，房地產行業的回歸分析還有多種用途，包括：

定價和租金的定價分析
住宅買家和租戶的人口統計和心理分析。
確定直銷目標
營銷活動的投資回報率分析

地理空間建模使用回歸分析的原理與房地產中最重要的三件事：位置、位置、位置。作為住宅開發商工作了八年，我可以證明地理空間建模的力量。使用 ArcGIS，我能夠整合銷售數據、地塊地圖和激光雷達數據，以找到最適合在北卡羅來納州山區開發的房產。

根據我的經驗，房地產的大部分資金是通過收購而不是開發項目獲得的。能夠識別其他人錯過的機會可能是房地產行業的巨大競爭優勢。地理空間分析是大公司多年來一直在利用的東西，但小公司經常忽略。

如何為您的企業確定合適的分析合作夥伴

很少有人會將統計數據列為他們最喜歡的科目。事實上，作為一個整體，即使是基本的概率，人們也很不擅長理解。如果您對此意見持懷疑態度，請前往拉斯維加斯或澳門。不幸的是，當您在流程中尋求有關實施回歸分析的建議時，這可能會使您難以確定信任誰。以下是評估潛在候選人時需要注意的一些關鍵事項

雖然人們不善於判斷概率，但直覺實際上更善於發現謊言。 你應該對任何聲稱能夠建立一個模型來回答你所有問題的人持懷疑態度！不要相信結果的保證。希望本文能夠說明回歸分析是基於經驗觀察和可靠科學的事實。某些事情總是比其他事情更容易預測。當一個值得信賴的顧問無法找到您正在尋找的答案時，他們會開誠佈公，並且他們不會花費您的預算試圖找到不存在的答案。

尋找斯波克先生而不是柯克船長。 合理的研究可能是一種出色的營銷工具，但人們常常為性感的營銷材料買單，帶有一絲偽研究的味道，而且沒有邏輯來支持它。有些人天生更善於分析，但出色的分析技能來自實踐。理想情況下，您僱用的任何人為您的業務分析數據都將具有為各種問題尋找解決方案的經驗。關注範圍狹窄的人可能更容易受到群體思維的影響，尤其是當他們的經歷與你的經歷密切相關時。

Put potential candidates on the spot with questions that help demonstrate their reasoning abilities. This is not the time to rely on behavioral questions alone. Ideal candidates will have the ability to strategically use known information to reasonably estimate the answer to complex problems. Ask logical reasoning questions, like “How many tennis balls could you fit in the Empire State Building?”

Finally, you should look for someone with whom you can communicate. All of the information in the world won't help if you can't put it to good use. If someone uses so much jargon in an introductory conversation that your eyes start to glaze over, then they probably aren't the right fit for your company.