Valutazione immobiliare utilizzando l'analisi di regressione: un tutorial

Pubblicato: 2022-03-11

Sintesi

L'analisi di regressione offre un approccio più scientifico per la valutazione immobiliare
  • Tradizionalmente, ci sono tre approcci per valutare la proprietà: vendite comparabili, reddito e costo.
  • I modelli di regressione forniscono un'alternativa più flessibile e obiettiva. È anche un processo che, una volta realizzato un modello, diventa autonomo, consentendo agli imprenditori immobiliari di concentrarsi sulle proprie competenze chiave.
  • Un modello può essere costruito con numerose variabili che vengono testate per l'impatto sul valore di un immobile, come la metratura e il numero di camere da letto.
  • Le regressioni non sono una bacchetta magica. Esiste sempre il pericolo che le variabili contengano autocorrelazione e/o multicollinearità, o che la correlazione tra variabili sia spuria.
Esempio: creazione di un modello di valutazione di regressione per Allegheny County, Pennsylvania
  • C'è una pletora di informazioni immobiliari a cui è possibile accedere elettronicamente per inserirle nei modelli. Le agenzie governative, i fornitori di dati professionali e Multiple Listing Services sono tre di queste fonti.
  • I dump dei dati iniziali richiedono un po' di pulizia per garantire che non vi siano insiemi irregolari di informazioni. Ad esempio, nel nostro campione, le case cedute in regalo sono state rimosse, per non falsare i risultati del fair market value.
  • Utilizzando un campione casuale del 10% dei dati, SPSS ha restituito le seguenti cinque variabili come le più predittive per il valore immobiliare:
    • Grado basato sulla qualità della costruzione classificato 1-19 (1=molto scarso e 19=eccellente)
    • Zona giorno finita
    • Aria Condizionata (Sì/No)
    • Dimensione del lotto
    • Grado per condizione fisica o stato di riparazione classificato 1-8
  • Testare i risultati è fondamentale, con il test di Durbin-Watson utilizzato per l'autocorrelazione e il test di Breusch-Pagan per l'eteroscedasticità. Nel nostro modello, c'erano lievi tendenze eteroschedastiche, il che indica che la variabilità di alcune variabili era diseguale nell'intero intervallo di valori.
L'analisi immobiliare basata sulla regressione può essere utile per la tua attività?
  • Oltre alla valutazione delle proprietà, l'analisi di regressione all'interno del settore immobiliare può essere particolarmente vantaggiosa in altre aree:
    • Il test restituisce le prestazioni sulle offerte passate
    • Analisi dei prezzi per prezzi di listino e canoni di locazione
    • Analisi demografica e psicografica di acquirenti e inquilini residenziali
    • Individuazione degli obiettivi per il marketing diretto
    • Analisi del ROI per le campagne di marketing
  • Inoltre, quando valuti i candidati per costruire modelli di regressione, diffida di coloro che promettono il mondo sin dal primo giorno. Costruire un modello di regressione robusto è un processo iterativo, quindi concentrati invece su coloro che sono naturalmente curiosi e possono pensare sul posto (cioè possono rispondere ai rompicapi con un processo di pensiero).

Troppo spesso nel settore immobiliare, il processo di valutazione può apparire come un esercizio di suzione del pollice. L'agente immobiliare verrà, prenderà a calci le proverbiali gomme e quindi produrrà un valore stimato con pochissime informazioni "quantitative". Forse il processo è esacerbato dall'attaccamento emotivo che il possesso di una proprietà comporta, dato che per molti una casa sarà il più grande investimento finanziario fatto in una vita.

Eppure, c'è un metodo per questa follia. Bene, tre per essere precisi.

Come viene valutata la proprietà?

L'approccio di vendita comparabile è più comune negli immobili residenziali e utilizza le vendite recenti di proprietà simili per determinare il valore di una proprietà in oggetto. I prezzi di vendita dei “comps” sono adeguati in base alle differenze tra gli stessi e l'immobile in oggetto. Ad esempio, se una proprietà comparabile dispone di un bagno aggiuntivo, il valore stimato del bagno viene sottratto dal prezzo di vendita osservato.

Gli immobili commerciali sono considerati più eterogenei, quindi l'approccio di vendita comparabile viene utilizzato meno frequentemente. L'approccio reddituale, basato sul concetto che il valore intrinseco di un'attività è equivalente alla somma di tutti i suoi flussi di cassa attualizzati, è più comunemente applicato attraverso due metodi:

  1. Simile al valore attuale di una rendita, il metodo della capitalizzazione diretta utilizza il reddito operativo netto (NOI) di un immobile diviso per il "tasso cap" per stabilire un valore. Il cap rate contiene un tasso di sconto implicito e un tasso di crescita futuro del reddito operativo netto.
  2. Il metodo dei flussi di cassa attualizzati fornisce il valore attuale dei flussi di cassa futuri in un determinato periodo di tempo, con un valore terminale che viene stimato utilizzando un tasso di capitalizzazione terminale.

La tecnica finale è l'approccio del costo, che stima il valore in base al costo dell'acquisizione di un appezzamento di terreno identico e della costruzione di una replica della proprietà in oggetto. Successivamente il costo del progetto viene ammortizzato in base all'attuale stato di obsolescenza dell'immobile in oggetto. Simile agli adeguamenti nell'approccio di vendita comparabile, l'obiettivo è quello di abbinare strettamente la proprietà in oggetto. L'approccio del costo è usato meno frequentemente rispetto agli altri due approcci.

Tutti i metodi tradizionali di valutazione immobiliare sono soggettivi, a causa della selezione degli input utilizzati per la valutazione. Ad esempio, la scelta del cap rate ha un impatto significativo sulla valutazione di una proprietà: quando si valuta un immobile con un NOI di $ 1 milione un aumento del 4% del cap rate (dal 6% al 10%) diminuirà il valore di la proprietà del 40% (grafico sotto).

cap rate ha un impatto sproporzionato sulla valutazione immobiliare

Vantaggi dell'utilizzo dei modelli di regressione nella valutazione immobiliare

Ci sono numerosi vantaggi nell'utilizzo dei modelli di regressione per la valutazione immobiliare. Il settore della vendita al dettaglio ha abbracciato il suo utilizzo per la selezione del sito, ma il settore immobiliare, per la maggior parte, ha trascurato i suoi potenziali vantaggi. L'analisi di regressione è particolarmente adatta per l'analisi di grandi quantità di dati. Sarebbe praticamente impossibile avere una conoscenza approfondita di ogni mercato immobiliare locale del paese, ma la modellazione di regressione può aiutare a restringere la ricerca.

1. Flessibilità

Il più grande vantaggio dell'utilizzo della modellazione di regressione è la sua flessibilità intrinseca: possono funzionare indipendentemente da altri modelli o insieme ad essi.

L'approccio più diretto consiste nell'utilizzare i dati di vendita esistenti per prevedere il valore di una proprietà in oggetto, come output per il modello. Esistono numerose fonti di dati gratuiti provenienti da agenzie locali, statali e federali che possono essere integrate con fornitori di dati privati.

Un'altra opzione consiste nell'utilizzare i modelli di regressione per prevedere con maggiore precisione gli input per altri metodi di valutazione tradizionali. Ad esempio, quando si analizza un progetto commerciale a uso misto, uno sviluppatore potrebbe costruire un modello per prevedere le vendite per metro quadrato per lo spazio commerciale e un altro modello per prevedere le tariffe di affitto per la componente residenziale. Entrambi potrebbero quindi essere utilizzati come input per un approccio reddituale per la valutazione.

2. Approccio obiettivo

Utilizzando solidi principi statistici si ottiene un approccio più obiettivo alla valutazione. È uno dei modi migliori per evitare il bias di conferma, che si verifica quando le persone cercano informazioni che confermino la loro opinione preesistente o rifiutano nuove informazioni che la contraddicono. Quando ho creato modelli per i rivenditori per prevedere le vendite di nuovi negozi, sono stati spesso sorpresi nell'apprendere che molti rivenditori traggono vantaggio dalla vicinanza a un concorrente. In effetti, la colocation con Walmart, che spesso era il loro più grande concorrente, era una delle variabili più comuni utilizzate nei miei modelli. Fare affidamento sui pregiudizi esistenti può portare a opportunità perse o, peggio ancora, nascondere disastri dietro l'angolo.

Alcuni dei vantaggi oggettivi della valutazione statistica sono i seguenti:

  1. L'analisi statistica consente di determinare la significatività statistica (affidabilità) dei singoli fattori nel modello.
  2. Sebbene l'analisi dello scenario o della sensibilità possa darti un'idea generale delle modifiche agli input nei metodi più tradizionali, è più simile a fare più previsioni piuttosto che darti un'idea migliore dell'accuratezza della previsione originale. D'altra parte, quando costruisci un modello di regressione, saprai quale sarà la gamma di risultati in base a un certo livello di confidenza.

I modelli di regressione sono unici in quanto dispongono di un controllo integrato per l'accuratezza. Dopo aver creato un modello su un campione della popolazione totale, è possibile utilizzare il modello su dati fuori campione per rilevare possibili errori di campionamento.

3. Attenersi alle proprie competenze di base

I metodi di valutazione tradizionali presentano tutti un rischio significativo di bias di selezione. Quando si scelgono proprietà comparabili, è molto facile cadere nella trappola di selezionare i migliori risultati e presumere che siano più simili al tuo progetto. C'è anche un'enfasi sulla previsione di variabili, come il tasso di rendimento nell'approccio del reddito. Eliminare la necessità di questa previsione potrebbe essere interessante per molti investitori immobiliari, motivo per cui la valutazione basata sulla regressione è un approccio utile.

Potenziali problemi con l'analisi di regressione

La quantità di battute che citano le percentuali variabili di statistiche che vengono inventate è davvero una barzelletta in sé. Siamo bombardati quasi ogni giorno dai titoli dei media sui risultati di un nuovo studio di ricerca, molti dei quali sembrano contraddire uno studio pubblicato l'anno scorso. In un mondo di suoni, non c'è tempo per discutere del rigore dei metodi utilizzati dai ricercatori.

Esistono molti tipi di analisi di regressione, ma la più comune è la regressione lineare. Ci sono alcune ipotesi sulle regressioni lineari che non dovrebbero essere violate per considerare valido il modello. La violazione di queste ipotesi distorce i test statistici che calcolano il potere predittivo degli input e del modello generale.

Assunzioni di regressione lineare

Ci dovrebbe essere una relazione lineare tra gli input (variabili indipendenti) e l'output (variabile dipendente). Ad esempio, potremmo supporre che esista una relazione lineare tra i piedi quadrati riscaldati in una casa e il suo valore complessivo. Tuttavia, a causa dei rendimenti decrescenti, potremmo scoprire che la relazione non è lineare e richiede una trasformazione dei dati grezzi.

esempio di regressione di relazioni lineari e non lineari

Le variabili indipendenti non dovrebbero essere casuali. In parole povere, le osservazioni per ogni variabile indipendente nel modello sono fisse e si presume che non abbiano errori nella loro misurazione. Ad esempio, se utilizziamo il numero di unità per modellare il valore di un condominio, tutti gli edifici nei nostri dati di esempio avranno un numero fisso di unità che non cambierà, indipendentemente da come costruiamo il modello.

I “residui” del modello (cioè la differenza tra il risultato previsto del modello e le osservazioni effettive) saranno sommati a 0, o in termini più semplici: il modello che utilizzeremo rappresenterà la linea di best fit.

Il modello dovrebbe essere accurato per tutte le osservazioni per ciascuna variabile indipendente. Se prevedessimo il valore di una casa in base alla sua metratura, non vorremmo utilizzare il modello se fosse estremamente accurato nella previsione dei valori per le case di dimensioni inferiori a 1.500 piedi quadrati, ma c'era una grande quantità di errore per le case di oltre 3.000 piedi quadrati. Questo è noto come eteroschedasticità.

esempio di eteroschedasticità e omoscedasticità

Uno dei problemi più comuni con la regressione lineare quando si osserva il settore immobiliare è una correlazione di errori residui tra le osservazioni. Puoi pensare a questo come un rumore bianco che non ha pattern. Tuttavia, se esiste uno schema per i residui, molto probabilmente è necessario apportare un aggiustamento. Questo problema è difficile da concettualizzare, ma ci sono due aree principali in cui questa è una preoccupazione nel settore immobiliare.

1. Autocorrelazione

Costruire un modello basato su osservazioni su un lungo periodo di tempo non sarebbe appropriato per prevedere i valori attuali. Supponiamo di aver costruito un modello per prevedere il valore di una struttura alberghiera utilizzando la tariffa media della camera come variabile indipendente. Il potere predittivo di questa variabile potrebbe essere fuorviante perché le tariffe delle camere sono aumentate costantemente nel tempo. In termini statistici, c'è un'autocorrelazione tra le tariffe medie osservate delle camere che mostrano un andamento positivo nel tempo (cioè l'inflazione) che non sarebbe contabilizzato nel modello. Il tradizionale approccio di vendita comparabile più ampiamente utilizzato nel settore immobiliare residenziale elimina questo problema utilizzando solo i dati più recenti. Poiché il numero di transazioni commerciali è molto inferiore, questo limite di tempo rende spesso inefficace l'approccio di vendita comparabile. Tuttavia, esistono tecniche che utilizzano la regressione lineare che possono superare i problemi di autocorrelazione.

L'effetto cluster è anche una sfida significativa nella modellazione della valutazione immobiliare. Questo può essere considerato come un'autocorrelazione spaziale. Il modo più semplice per pensare a questo problema è immaginare di costruire un modello per prevedere il valore delle case in due quartieri (A e B) su entrambi i lati di un'autostrada. Nel complesso, il modello può funzionare bene nella previsione dei valori, ma quando esaminiamo gli errori residui notiamo che esiste un modello. Le case nel quartiere A sono generalmente sopravvalutate di circa il 10% e le case nel quartiere B sono sottovalutate di circa il 10%. Per migliorare il nostro modello, dobbiamo tenere conto di questo effetto cluster o costruire un modello per ogni quartiere.

2. Multicollinearità

Idealmente, le variabili all'interno di un modello non saranno correlate tra loro. Questo problema noto è chiamato multicollinearità. L'utilizzo sia dei piedi quadrati che del numero di parcheggi come input per un modello che valuta i centri commerciali regionali dimostrerebbe probabilmente la multicollinearità. Questo è intuitivo perché i codici di pianificazione richiedono spesso un certo numero di posti auto in base alla metratura di uno spazio commerciale. In questo esempio, la rimozione di una delle variabili darebbe una valutazione più accurata del modello aggiustato senza ridurne significativamente il potere predittivo.

altre considerazioni

L'utilizzo dei dati osservati è il fulcro di qualsiasi approccio empirico, ma è importante ricordare che i risultati passati non sempre predicono il futuro. Gli asset illiquidi come gli immobili sono particolarmente vulnerabili ai cambiamenti del ciclo economico. È probabile che il potere predittivo per alcune variabili cambi in base alle attuali condizioni economiche. Questo problema non è esclusivo della regressione lineare e si trova anche con gli approcci tradizionali.

La correlazione non è uguale a causalità. Lo scopo della costruzione del modello è trovare variabili utili che possano fare previsioni valide. Devi stare attento alle correlazioni spurie. Potresti essere sorpreso di apprendere che esiste una correlazione estremamente forte tra il tasso di divorzi nel Maine e il consumo pro capite di margarina. Tuttavia, l'utilizzo dei dati sul divorzio dal Maine non avrebbe senso se si stesse cercando di prevedere le future vendite di margarina.

Un esempio reale di valutazione immobiliare tramite regressione

Applichiamo ora questa conoscenza in modo pratico e costruiamo un modello lineare dall'inizio alla fine. Per il nostro esempio, tenteremo di costruire un modello di valutazione immobiliare che preveda il valore delle case unifamiliari nella contea di Alleghany, in Pennsylvania. La scelta della contea di Alleghany è arbitraria e i presidi dimostrati funzioneranno per qualsiasi luogo. Useremo Excel e SPSS, che è un software statistico comunemente usato.

Trovare dati

Trovare dati di qualità è il primo passo nella costruzione di un modello accurato e forse il più importante. Anche se tutti abbiamo sentito la frase "spazzatura dentro, spazzatura fuori", è importante ricordare che non esiste un set di dati perfetto. Questo va bene fintanto che possiamo tranquillamente presumere che i dati del campione siano rappresentativi dell'intera popolazione. Esistono tre fonti principali di dati immobiliari:

  1. La prima e spesso la migliore fonte di dati proviene dalle agenzie governative. Gran parte di questi dati sono gratuiti o relativamente a basso costo. Molte aziende ti addebiteranno i dati che potresti facilmente ottenere gratuitamente, quindi dai sempre una rapida occhiata a Internet prima di acquistare i dati. Una ricerca sul Web produce spesso risultati cercando la contea o la città che stai cercando e parole come "valutatore fiscale", "stime fiscali", "registri immobiliari" o "ricerca di atti". I dipartimenti dei sistemi informativi geografici (GIS) sono una delle parti più trascurate di molte comunità. Spesso hanno gran parte dei dati aggregati da varie altre agenzie locali. In qualità di sviluppatore immobiliare, ho spesso fatto affidamento sul loro aiuto per trovare dati di alta qualità che ho utilizzato per creare modelli per individuare nuove proprietà da sviluppare. Anche le organizzazioni di sviluppo economico possono essere un'ottima fonte di dati.
  2. I fornitori a scopo di lucro sono un'altra opzione. Sono particolarmente utili quando cerchi dati in più aree. Assicurati di fare i compiti prima di pagare ingenti somme di denaro per i loro dati. Non fare affidamento solo sui loro set di dati campione, perché potrebbe essere fuorviante in termini di completezza. In caso di dubbi su quali dati hanno a disposizione, contattare direttamente un rappresentante o richiedere una garanzia di rimborso.
  3. Infine, i Multiple Listing Services (MLS) locali sono una risorsa inestimabile. La maggior parte delle proprietà sono commercializzate tramite un agente immobiliare che è membro di una MLS. In genere, i membri di un MLS sono tenuti a inserire tutti i loro elenchi nel sistema locale. Sfortunatamente, ci sono spesso molte restrizioni sull'adesione a un MLS e il costo dell'accesso ai dati può essere piuttosto elevato. È anche importante assicurarsi di non violare i termini di servizio quando si utilizzano i loro dati e aprirsi a potenziali responsabilità.

Utilizzeremo esclusivamente dati gratuiti per il nostro esempio, provenienti dal Western Pennsylvania Regional Data Center e dall'US Census Bureau. I dati Alleghany Real Estate Sales ci forniranno un file di base per le nostre osservazioni con il prezzo di vendita come nostra variabile dipendente (variabile Y). Verificheremo anche le variabili utilizzando il punteggio di camminata per ciascun tratto di censimento e le informazioni sulla valutazione fiscale.

Una variabile molto utile da avere quando si costruiscono modelli immobiliari è la latitudine e la longitudine di ciascun indirizzo. È possibile ottenere questi dati tramite un geocoder che utilizza un indirizzo stradale per assegnare una latitudine e una longitudine. Il geocodificatore dell'US Census Bureau identificherà anche il tratto di censimento per ciascuna località che viene comunemente utilizzato per aggregare informazioni demografiche e psicografiche.

Analizzare, trasformare e creare nuove variabili.

Ora che abbiamo selezionato le nostre origini dati, dobbiamo esaminare la qualità dei dati. Il modo più semplice per verificare la qualità dei dati è eseguire una tabella di frequenza per alcune variabili chiave. Se è presente un numero significativo di voci mancanti o danneggiate, dovremo esaminare ulteriormente i dati. La tabella seguente mostra che solo 1 record su 216.498 ha un codice postale mancante nel file di vendita e non sono presenti codici postali errati come 99999 o 1X#45. Questo probabilmente indica che si tratta di un set di dati di alta qualità.

tabella degli errori

Un dizionario di dati è una risorsa eccellente quando disponibile. Fornirà una descrizione di ciò che ciascuna variabile sta misurando e le possibili opzioni per la variabile. I nostri dati contengono un'analisi di ogni vendita effettuata nella contea. Si tratta di informazioni chiave, soprattutto quando si lavora con record di atti grezzi. Tutte le transazioni immobiliari devono essere registrate per essere esecutive per legge, ma non tutti i trasferimenti riflettono il vero valore equo di mercato di un immobile. Ad esempio, una vendita tra due membri della famiglia potrebbe essere a un prezzo inferiore a quello di mercato come forma di regalo o per evitare di pagare costi di transazione più elevati come i francobolli. Fortunatamente per noi, il governo locale contrassegna chiaramente i trasferimenti che ritengono non rappresentativi dei valori di mercato attuali, quindi utilizzeremo solo i record che riflettono una "vendita valida". Queste vendite rappresentano solo il 18% circa del numero totale di transazioni, dimostrando quanto sia importante comprendere i dati prima di iniziare a utilizzarli per l'analisi. Sulla base della mia esperienza, questo rapporto è abbastanza comune quando si analizzano i record degli atti. È molto probabile che se costruissimo un modello che includa le “vendite non valide” i nostri risultati finali sarebbero distorti.

Successivamente, aggiungeremo i nostri dati di valutazione e i punteggi delle passeggiate al file di vendita. Questo ci dà una singola tabella da utilizzare per il nostro modello. A questo punto, dobbiamo analizzare le variabili per vedere se sono appropriate per la regressione lineare. Di seguito è riportata una tabella che mostra vari tipi di variabili.

test variabile per le regressioni

Il nostro file contiene diversi valori nominali come il quartiere o il codice postale, che classificano i dati senza alcun senso dell'ordine. I valori nominali non sono appropriati per la regressione lineare senza trasformazione. Ci sono anche diverse variabili ordinali che classificano la qualità della costruzione, le condizioni attuali della proprietà, ecc. L'uso dei dati ordinali è appropriato solo quando possiamo ragionevolmente presumere che ogni rango sia uniformemente distanziato. Ad esempio, i nostri dati hanno una variabile di voto con 19 diverse classificazioni (A+, A, A-, ecc.), quindi possiamo tranquillamente presumere che questi voti siano probabilmente equidistanti.

Ci sono anche diverse variabili che devono essere trasformate prima di poterle utilizzare nel modello. Un valore nominale che può essere trasformato in una variabile fittizia per il test è la variabile di riscaldamento e raffreddamento. Imposteremo la variabile su 0 per tutte le proprietà senza aria condizionata e quelle con aria condizionata su 1. Inoltre, i voti delle lettere devono essere convertiti in numeri (ad es. 0=Peggiore, 1=Migliore, 2=Migliore) per vedere se esiste una relazione lineare con il prezzo.

Infine, dobbiamo determinare se è appropriato utilizzare tutte le osservazioni. Vogliamo prevedere i valori delle case unifamiliari, in modo da poter eliminare tutte le proprietà commerciali, i condomini e le case a schiera dai dati. Vogliamo anche evitare potenziali problemi con l'autocorrelazione, quindi utilizziamo solo i dati per le vendite nel 2017 per limitare la probabilità che ciò si verifichi. Dopo aver eliminato tutti i record estranei, abbiamo il nostro set di dati finale da testare.

Selezione di campioni e variabili

Selezionare la dimensione del campione corretta può essere complicato. Tra i materiali accademici, ci sono un'ampia gamma di numeri minimi suggeriti e varie regole pratiche. Per il nostro studio, la popolazione complessiva è piuttosto ampia, quindi non dobbiamo preoccuparci di averne abbastanza per un campione. Corriamo invece il rischio di avere un campione così grande che quasi ogni variabile avrà una significatività statistica nel modello. Alla fine, circa il 10% dei record è stato selezionato casualmente per la modellazione.

La selezione delle variabili può essere una delle parti più difficili del processo senza un software statistico. Tuttavia, SPSS ci consente di costruire rapidamente molti modelli da una combinazione di variabili che abbiamo ritenuto appropriate per una regressione lineare. SPSS filtrerà automaticamente le variabili in base alle nostre soglie di significatività statistica e restituirà solo i modelli migliori.

Costruzione del modello e revisione dei risultati

Dai nostri dati campione, SPSS ha prodotto cinque modelli. Il modello più predittivo includeva le seguenti 5 variabili.

  1. Grado basato sulla qualità della costruzione classificato 1-19 (1=molto scarso e 19=eccellente)
  2. Zona giorno finita
  3. Aria Condizionata (Sì/No)
  4. Dimensione del lotto
  5. Grado per condizione fisica o stato manutentivo classificato 1-8 (1=Inabitabile e 8=eccellente)

Diamo un'occhiata ai risultati di SPSS. Il nostro obiettivo principale sarà inizialmente il valore R-quadrato che ci dice quale percentuale di varianza nella variabile dipendente (prezzo) è prevista dalla regressione. Il miglior valore possibile sarebbe 1 e il risultato del nostro modello è piuttosto promettente. L'errore standard della stima che misura la precisione del modello sembra essere piuttosto alto a $ 73.091. Tuttavia, se lo confrontiamo con la deviazione standard del prezzo di vendita nel modello ($ 160.429), l'errore sembra ragionevole.

Uscita di regressione 1

Il modello 5 presentava un errore standard accettabile e supera il test Durbin-Watson

SPSS ha funzionalità integrate per testare l'autocorrelazione utilizzando il test Durbin-Watson. Idealmente, il valore sarebbe 2,0 su una scala da 0 a 4, ma un valore di 1,652 non dovrebbe causare un allarme.

Successivamente, testiamo i risultati del modello per determinare se ci sono prove di eteroschedasticità. Non ci sono funzionalità integrate per SPSS, ma usando questa macro scritta da Ahmad Daryanto possiamo usare i test di Breusch-Pagan e Koenker. Questi test mostrano che nel nostro modello è presente eteroschedasticità poiché il livello di significatività (Sig) nel grafico sottostante è inferiore a .005. Il nostro modello ha violato una delle ipotesi classiche della regressione lineare. Molto probabilmente una delle variabili nel modello deve essere trasformata per eliminare il problema. Tuttavia, prima di farlo è una buona idea vedere quali sono gli effetti dell'eteroscedasticità sul potere predittivo delle nostre variabili indipendenti. Attraverso l'uso di una macro sviluppata da Andrew F. Hayes, possiamo esaminare gli errori standard corretti e i livelli di significatività per le nostre variabili indipendenti.

Uscita di regressione 2

Nel modello è presente eteroschedasticità, ma ulteriori test mostrano che non influisce sulle variabili indipendenti

Ulteriori test rivelano che le variabili indipendenti rimangono statisticamente significative, dopo aver tenuto conto dell'eteroscedasticità nel modello, quindi per ora non dobbiamo necessariamente modificarlo.

Testare e perfezionare il modello

Come test finale, valuteremo tutti i record di vendita che non facevano parte del campione originale con il nostro modello. Questo ci aiuterà a vedere come si comporta il modello su un insieme più ampio di dati. I risultati di questo test mostrano che il valore R quadrato e l'errore standard della stima non sono cambiati in modo significativo sull'ampio set di dati, il che probabilmente indica che il nostro modello funzionerà come previsto.

Uscita di regressione 3

L'applicazione del modello al set di dati completo mostra la coerenza con il campione, con valori di errore R quadrati e standard simili osservati

Se volessimo utilizzare il nostro modello di esempio nella vita reale, probabilmente segmenteremmo ulteriormente i dati per avere diversi modelli più precisi o cercheremmo dati aggiuntivi per migliorare la precisione di questo singolo modello. Questi passaggi probabilmente rimuoverebbero anche l'eteroscedasticità che abbiamo visto presente nel modello. Sulla base del fatto che stavamo tentando di utilizzare un unico modello per prevedere il valore delle case in una contea con oltre 1 milione di persone, non dovrebbe sorprendere che non siamo stati in grado di costruire il modello "perfetto" in solo un paio d'ore .

Conclusioni

Il nostro obiettivo era costruire un modello che prevedesse il valore delle case unifamiliari. La nostra analisi mostra che abbiamo raggiunto questo obiettivo con una ragionevole precisione, ma il nostro modello ha senso?

Se dovessimo descrivere il nostro modello, diremmo che il valore di una casa dipende dalle dimensioni del lotto, dalla metratura della casa, dalla qualità della costruzione, dallo stato manutentivo attuale e dal fatto che abbia o meno aria condizionata. Questo sembra molto ragionevole. Infatti, se confrontiamo il nostro modello con i metodi di valutazione tradizionali, vediamo che è molto simile all'approccio del costo, che aggiunge il costo dell'acquisizione di terreni e della costruzione di un nuovo edificio adeguato all'attuale stato di obsolescenza. Tuttavia, questa somiglianza potrebbe essere, per usare una frase di regressione, una correlazione spuria.

In genere, l'approccio basato sui costi è consigliato solo per valutare le proprietà più recenti, a causa dei problemi con la determinazione del metodo appropriato per l'ammortamento delle proprietà più vecchie. Con il nostro modello, abbiamo creato una strategia simile che è utile per proprietà di qualsiasi età, infatti, abbiamo testato l'età come variabile indipendente e abbiamo concluso che non ha alcun impatto statisticamente significativo sul valore delle proprietà!

Utilizzo dell'analisi di regressione per la tua azienda

Si spera che a questo punto tu abbia una migliore comprensione delle basi dell'analisi di regressione. La prossima domanda è: può aiutare la tua azienda? Se rispondi sì a una di queste domande, probabilmente potresti trarre vantaggio dall'utilizzo dell'analisi di regressione come strumento.

  1. Vuoi un approccio più scientifico per determinare il valore, fare proiezioni o analizzare un mercato particolare?
  2. Stai cercando modi migliori per identificare potenziali investimenti immobiliari in vaste aree, regioni o persino a livello nazionale?
  3. Il tuo obiettivo è attirare grandi rivenditori, ristoranti o società di ospitalità per il tuo progetto immobiliare commerciale?
  4. Pensi di poter potenzialmente migliorare il tuo processo decisionale incorporando nuovi punti dati nel processo?
  5. Sei preoccupato per il ritorno sul tuo investimento nel marketing per acquirenti e investitori?

Il modello di esempio sopra è una semplice dimostrazione del valore dell'utilizzo della modellazione di regressione nel settore immobiliare. Le 2-3 ore necessarie per raccogliere i dati e costruire il modello sono lontane dal mostrare il suo pieno potenziale. In pratica, ci sono un'ampia varietà di usi per l'analisi di regressione nel settore immobiliare oltre alla valutazione degli immobili, tra cui:

  1. Analisi dei prezzi per prezzi di listino e canoni di locazione
  2. Analisi demografica e psicografica di acquirenti e inquilini residenziali.
  3. Individuazione degli obiettivi per il marketing diretto
  4. Analisi del ROI per le campagne di marketing

La modellazione geospaziale utilizza i principi dell'analisi di regressione abbinati alle tre cose più importanti nel settore immobiliare: posizione, posizione, posizione. Lavorando come sviluppatore residenziale per otto anni posso attestare il potere della modellazione geospaziale. Utilizzando ArcGIS, sono stato in grado di incorporare dati di vendita, mappe dei pacchi e dati lidar per trovare proprietà ideali per lo sviluppo nelle montagne della Carolina del Nord.

Sulla base della mia esperienza, la maggior parte dei soldi nel settore immobiliare viene fatta per l'acquisizione e non per lo sviluppo di un progetto. Essere in grado di identificare le opportunità che gli altri perdono può essere un enorme vantaggio competitivo nel settore immobiliare. L'analisi geospaziale è qualcosa di cui le grandi aziende hanno approfittato per molti anni, ma le aziende più piccole spesso trascurano.

Come identificare il partner di analisi giusto per la tua azienda

Pochissime persone classificherebbero le statistiche come la loro materia preferita. In effetti, nel complesso, le persone sono molto pessime nel comprendere anche le probabilità di base. Se dubiti di questa opinione, fai un viaggio a Las Vegas o Macao. Sfortunatamente, questo può rendere difficile determinare di chi fidarsi quando cerchi consigli sull'implementazione dell'analisi di regressione nel tuo processo. Ecco alcune cose chiave da cercare quando si valutano potenziali candidati

Mentre le persone sono pessime nel giudicare le probabilità, l'intuizione è in realtà piuttosto brava a rilevare le bugie. Dovresti essere molto scettico nei confronti di chiunque affermi di essere in grado di costruire un modello che risponderà a tutte le tue domande! Non fidarti di una garanzia di risultati. Si spera che questo articolo abbia illustrato il fatto che l'analisi di regressione si basa sull'osservazione empirica e su una solida scienza. Sarà sempre il caso che alcune cose siano più facili da prevedere rispetto ad altre. Un consulente fidato sarà aperto e onesto quando non riesce a trovare le risposte che stai cercando e non esaurirà il tuo budget cercando di trovarne una che non c'è.

Cerca il signor Spock invece del capitano Kirk. Una solida ricerca può essere un eccellente strumento di marketing, ma troppo spesso le persone pagano per materiali di marketing sexy con un pizzico di pseudo-ricerca e nessuna logica a sostegno. Alcune persone sono naturalmente più analitiche, ma grandi capacità analitiche derivano dalla pratica. Idealmente, chiunque assumi per analizzare i dati per la tua azienda avrà esperienza nella ricerca di soluzioni a un'ampia varietà di problemi. Qualcuno con un focus ristretto potrebbe essere più suscettibile al pensiero di gruppo, specialmente quando le sue esperienze rispecchiano da vicino le tue.

Put potential candidates on the spot with questions that help demonstrate their reasoning abilities. This is not the time to rely on behavioral questions alone. Ideal candidates will have the ability to strategically use known information to reasonably estimate the answer to complex problems. Ask logical reasoning questions, like “How many tennis balls could you fit in the Empire State Building?”

Finally, you should look for someone with whom you can communicate. All of the information in the world won't help if you can't put it to good use. If someone uses so much jargon in an introductory conversation that your eyes start to glaze over, then they probably aren't the right fit for your company.