Evaluarea imobiliară folosind analiza de regresie – Un tutorial
Publicat: 2022-03-11Rezumat
Analiza de regresie oferă o abordare mai științifică pentru evaluarea imobiliară
- În mod tradițional, există trei abordări pentru evaluarea proprietății: vânzări comparabile, venituri și costuri.
- Modelele de regresie oferă o alternativă mai flexibilă și mai obiectivă. Este, de asemenea, un proces care odată ce un model este realizat, devine autonom, permițând antreprenorilor imobiliari să se concentreze asupra competențelor lor de bază.
- Un model poate fi construit cu numeroase variabile care sunt testate pentru impactul asupra valorii unei proprietăți, cum ar fi metri pătrați și numărul de dormitoare.
- Regresiile nu sunt un glonț magic. Există întotdeauna pericolul ca variabilele să conțină autocorelare și/sau multicoliniaritate sau ca corelația dintre variabile să fie falsă.
Exemplu: construirea unui model de evaluare de regresie pentru Allegheny County, Pennsylvania
- Există o multitudine de informații imobiliare care pot fi accesate electronic pentru a fi introduse în modele. Agențiile guvernamentale, furnizorii profesioniști de date și serviciile de listări multiple sunt trei astfel de surse.
- Evacuările inițiale de date necesită o anumită curățare pentru a se asigura că nu există seturi neregulate de informații. De exemplu, în eșantionul nostru, casele care au fost transferate ca cadouri au fost eliminate, pentru a nu distorsiona rezultatele valorii juste de piață.
- Folosind un eșantion aleatoriu din 10% din date, SPSS a returnat următoarele cinci variabile ca fiind cele mai predictive pentru valoarea imobiliară:
- Nota bazată pe calitatea construcției, clasată 1-19 (1 = Foarte slab și 19 = Excelent)
- Suprafata de locuit finisata
- Aer condiționat (Da/Nu)
- Mărimea lotului
- Nota pentru condiția fizică sau starea de reparație clasată 1-8
- Testarea rezultatelor este critică, testul Durbin-Watson utilizat pentru autocorelare și testul Breusch-Pagan pentru heteroscedasticitate. În modelul nostru, au existat ușoare tendințe heteroscedastice, ceea ce indică faptul că variabilitatea unor variabile a fost inegală pe întregul interval de valori.
Analiza imobiliară bazată pe regresie poate fi utilă pentru afacerea dvs.?
- Pe lângă evaluarea proprietăților, analiza de regresie în domeniul imobiliar poate fi deosebit de benefică în alte domenii:
- Testarea returnează performanța la ofertele anterioare
- Analiza prețurilor pentru prețurile de listă și tarifele de închiriere
- Analiza demografică și psihografică a cumpărătorilor și chiriașilor de locuințe
- Identificarea tintelor pentru marketing direct
- Analiza ROI pentru campanii de marketing
- În plus, atunci când evaluați candidații pentru a construi modele de regresie, aveți grijă de cei care promit lumii încă din prima zi. Construirea unui model de regresie robust este un proces iterativ, așa că, în schimb, concentrați-vă pe cei care sunt curioși în mod natural și pot gândi la fața locului (adică pot răspunde la jocurile de creiere cu un proces de gândire).
Prea des în domeniul imobiliar, procesul de evaluare poate fi considerat un exercițiu de supt degetul mare. Agentul imobiliar va veni, va da cu piciorul în cauciucurile proverbiale și apoi va produce o valoare estimată cu foarte puține informații „cantitative”. Poate că procesul este exacerbat de atașamentul emoțional pe care îl aduce deținerea unei proprietăți, dat fiind că pentru mulți, o casă va fi cea mai mare investiție financiară făcută într-o viață.
Cu toate acestea, există o metodă pentru această nebunie. Ei bine, trei pentru a fi mai precis.
Cum este evaluată proprietatea?
Abordarea vânzărilor comparabile este cea mai comună în imobilele rezidențiale și utilizează vânzările recente de proprietăți similare pentru a determina valoarea unei proprietăți în cauză. Prețul de vânzare al „comps” este ajustat în funcție de diferențele dintre acestea și proprietatea în cauză. De exemplu, dacă o proprietate comparabilă are o baie suplimentară, atunci valoarea estimată a băii este scăzută din prețul de vânzare observat.
Imobilul comercial este considerat a fi mai eterogene, astfel încât abordarea vânzărilor comparabile este utilizată mai rar. Abordarea venitului, bazată pe conceptul că valoarea intrinsecă a unui activ este echivalentă cu suma tuturor fluxurilor sale de numerar actualizate, este mai frecvent aplicată prin două metode:
- Similar cu valoarea actuală a unei anuități, metoda capitalizării directe utilizează venitul net din exploatare (NOI) al unei proprietăți împărțit la „rata plafon” pentru a stabili o valoare. Rata plafonului conține o rată de actualizare implicită și o rată de creștere viitoare a venitului operațional net.
- Metoda fluxurilor de numerar actualizate furnizează valoarea actualizată a fluxurilor de numerar viitoare pe o perioadă de timp stabilită, cu o valoare terminală care este estimată utilizând o rată maximă terminală.
Tehnica finală este abordarea prin cost, care estimează valoarea pe baza costului achiziționării unei părți identice de teren și construirii unei replici a proprietății în cauză. Apoi costul proiectului este amortizat în funcție de starea actuală de uzură a proprietății în cauză. Similar cu ajustările în abordarea vânzărilor comparabile, scopul este de a se potrivi îndeaproape cu proprietatea în cauză. Abordarea costurilor este utilizată mai puțin frecvent decât celelalte două abordări.
Toate metodele tradiționale de evaluare imobiliară sunt subiective, datorită selecției inputurilor utilizate pentru evaluare. De exemplu, alegerea ratei plafonului are un impact semnificativ asupra evaluării unei proprietăți: atunci când evaluați o proprietate cu un NOI de 1 milion USD, o creștere cu 4% a ratei plafonului (de la 6% la 10%) va scădea valoarea proprietatea cu 40% (Graficul de mai jos).
Beneficiile utilizării modelelor de regresie în evaluarea imobiliară
Există numeroase beneficii ale utilizării modelelor de regresie pentru evaluarea imobiliară. Industria comerțului cu amănuntul a acceptat utilizarea sa pentru selectarea site-urilor, dar industria imobiliară, în cea mai mare parte, a trecut cu vederea potențialele sale avantaje. Analiza de regresie este potrivită în special pentru analiza unor cantități mari de date. Ar fi practic imposibil să aveți o cunoaștere solidă a fiecărei piețe imobiliare locale din țară, dar modelarea regresiei poate ajuta la restrângerea căutării.
1. Flexibilitate
Cel mai mare beneficiu al utilizării modelării regresiei este flexibilitatea sa inerentă - pot funcționa independent de alte modele sau în concordanță cu acestea.
Cea mai directă abordare este utilizarea datelor de vânzări existente pentru a prezice valoarea unei proprietăți subiect, ca rezultat al modelului. Există numeroase surse de date gratuite de la agențiile locale, statale și federale, care pot fi completate cu furnizori de date privați.
O altă opțiune este utilizarea modelelor de regresie pentru a prezice cu mai multă acuratețe intrările pentru alte metode tradiționale de evaluare. De exemplu, atunci când analizează un proiect comercial cu utilizare mixtă, un dezvoltator ar putea construi un model pentru a estima vânzările pe metru pătrat pentru spațiul comercial și un alt model pentru a prezice tarifele de închiriere pentru componenta rezidențială. Ambele ar putea fi apoi utilizate ca intrare pentru o abordare a veniturilor pentru evaluare.
2. Abordarea obiectivă
Utilizarea unor principii statistice solide conduce la o abordare mai obiectivă a evaluării. Este una dintre cele mai bune modalități de a evita părtinirea de confirmare, care apare atunci când oamenii caută informații care confirmă opinia lor preexistentă sau resping informații noi care o contrazic. Când am construit modele pentru retaileri pentru a prezice noile vânzări în magazine, ei au fost adesea surprinși să afle că mulți retaileri beneficiază de a fi aproape de un concurent. De fapt, colocarea cu Walmart, care era adesea cel mai mare competitor al lor, a fost una dintre cele mai frecvente variabile folosite în modelele mele. Bazându-ne pe părtinirile existente poate duce la oportunități ratate sau chiar mai rău, la ascunderea dezastrelor chiar după colț.
Unele dintre avantajele obiective ale evaluării statistice sunt următoarele:
- Analiza statistică vă permite să determinați semnificația statistică (fiabilitatea) factorilor individuali din model.
- În timp ce analiza de scenariu sau de sensibilitate vă poate oferi o idee generală despre modificările aduse intrărilor în metode mai tradiționale, este mai asemănătoare cu a face predicții multiple decât să vă ofere o idee mai bună despre acuratețea predicției originale. Pe de altă parte, atunci când construiți un model de regresie, veți ști care va fi gama de rezultate pe baza unui anumit nivel de încredere.
Modelele de regresie sunt unice prin faptul că au o verificare încorporată pentru precizie. După construirea unui model pe un eșantion din populația totală, puteți utiliza modelul pe date din afara eșantionului pentru a detecta posibile distorsiuni de eșantionare.
3. Respectați-vă competențele de bază
Metodele tradiționale de evaluare au toate un risc semnificativ de părtinire a selecției. Atunci când alegeți proprietăți comparabile, este foarte ușor să cădeți în capcana de a selecta cele mai bune rezultate și de a presupune că acestea seamănă cel mai mult cu proiectul dvs. De asemenea, se pune accent pe predicția variabilelor, cum ar fi rata rentabilității în abordarea venitului. Eliminarea necesității acestei predicții ar putea fi atractivă pentru mulți investitori imobiliari, motiv pentru care evaluarea bazată pe regresie este o abordare utilă.
Probleme potențiale cu analiza de regresie
Numărul de glume care citează procentele diferite de statistici care sunt alcătuite este într-adevăr o glumă în sine. Suntem bombardați aproape în fiecare zi cu titluri media despre rezultatele unui nou studiu de cercetare, dintre care multe par să contrazică un studiu publicat anul trecut. Într-o lume a sunetelor, nu există timp pentru a discuta rigurozitatea metodelor folosite de cercetători.
Există multe tipuri de analiză de regresie, dar cea mai comună este regresia liniară. Există anumite ipoteze despre regresiile liniare care nu ar trebui încălcate pentru a considera modelul valid. Încălcarea acestor ipoteze denaturează testele statistice care calculează puterea predictivă a intrărilor și a modelului general.
Ipoteze de regresie liniară
Ar trebui să existe o relație liniară între intrări (variabile independente) și ieșire (variabilă dependentă). De exemplu, am putea presupune că există o relație liniară între picioarele pătrate încălzite dintr-o casă și valoarea sa globală. Totuși, din cauza randamentelor descrescătoare, am putea descoperi că relația este neliniară, necesitând o transformare a datelor brute.
Variabilele independente nu trebuie să fie aleatoare. Mai simplu spus, observațiile pentru fiecare variabilă independentă din model sunt fixe și se presupune că nu au nicio eroare în măsurarea lor. De exemplu, dacă folosim numărul de unități pentru a modela valoarea unui bloc de apartamente, toate clădirile din datele noastre eșantion vor avea un număr fix de unități care nu se vor schimba, indiferent de modul în care construim modelul.
„Reziduurile” modelului (adică diferența dintre rezultatul prezis al modelului și observațiile reale) se vor însuma la 0, sau în termeni mai simpli: modelul pe care îl vom folosi va reprezenta linia de cea mai bună potrivire.
Modelul ar trebui să fie precis pentru toate observațiile pentru fiecare variabilă independentă. Dacă am prezis valoarea unei case pe baza suprafeței sale pătrate, nu am dori să folosim modelul dacă ar fi extrem de precis în estimarea valorilor pentru case sub 1.500 de metri pătrați, dar a existat o mare cantitate de eroare pentru casele de peste 3.000 de metri pătrați. picioare pătrate. Acest lucru este cunoscut sub numele de heteroscedasticitate.
Una dintre cele mai frecvente probleme cu regresia liniară atunci când ne uităm la industria imobiliară este corelarea erorilor reziduale între observații. Vă puteți gândi la asta ca la un zgomot alb care nu are niciun model. Cu toate acestea, dacă există un model pentru reziduuri, atunci cel mai probabil trebuie să facem o ajustare. Această problemă este greu de conceptualizat, dar există două domenii principale în care aceasta este o preocupare în industria imobiliară.
1. Autocorelare
Construirea unui model bazat pe observații pe o perioadă lungă de timp ar fi inadecvată pentru prezicerea valorilor curente. Să presupunem că am construit un model pentru a prezice valoarea unei proprietăți de hotel folosind tariful mediu al camerei ca variabilă independentă. Puterea predictivă a acestei variabile ar putea induce în eroare, deoarece tarifele camerelor au crescut constant de-a lungul timpului. În termeni statistici, există o autocorelație între tarifele medii observate ale camerelor care arată o tendință pozitivă în timp (adică inflația) care nu ar fi luată în considerare în model. Abordarea tradițională a vânzărilor comparabile, cea mai utilizată în domeniul imobiliar rezidențial, elimină această problemă prin utilizarea doar a celor mai recente date. Deoarece există un număr mult mai mic de tranzacții comerciale, această restricție de timp face adesea ineficientă abordarea de vânzare comparabilă. Cu toate acestea, există tehnici care folosesc regresia liniară care pot depăși problemele de autocorelare.
Efectul de cluster este, de asemenea, o provocare semnificativă în modelarea evaluării imobiliare. Aceasta poate fi considerată ca autocorelare spațială. Cel mai simplu mod de a gândi această problemă este să vă imaginați construirea unui model pentru a prezice valoarea caselor din două cartiere (A și B) de fiecare parte a unei autostrăzi. În ansamblu, modelul poate funcționa bine în prezicerea valorilor, dar când examinăm erorile reziduale observăm că există un model. Casele din cartierul A sunt în general supraevaluate cu aproximativ 10%, iar casele din cartierul B sunt cu aproximativ 10% subevaluate. Pentru a ne îmbunătăți modelul, trebuie să luăm în considerare acest efect de cluster sau să construim un model pentru fiecare cartier.
2. Multicoliniaritate
În mod ideal, variabilele dintr-un model nu vor fi corelate între ele. Această problemă cunoscută se numește multicoliniaritate. Utilizarea atât a picioarelor pătrate, cât și a numărului de locuri de parcare ca intrări pentru un model de evaluare a mall-urilor regionale ar demonstra probabil multicoliniaritatea. Acest lucru este intuitiv deoarece codurile de planificare necesită adesea un anumit număr de locuri de parcare în funcție de suprafața pătrată a unui spațiu comercial. În acest exemplu, eliminarea uneia dintre variabile ar oferi o evaluare mai precisă a modelului ajustat, fără a reduce semnificativ puterea sa predictivă.
Alte considerații
Utilizarea datelor observate este nucleul oricărei abordări empirice, dar este important să ne amintim că rezultatele din trecut nu prezic întotdeauna viitorul. Activele nelichide, cum ar fi imobiliare, sunt deosebit de vulnerabile la schimbările ciclului de afaceri. Puterea de predicție pentru anumite variabile este probabil să se schimbe în funcție de condițiile economice actuale. Această problemă nu este unică pentru regresia liniară și este găsită și în abordările tradiționale.
Corelația nu înseamnă cauzalitate. Scopul construirii modelului este de a găsi variabile utile care vor face predicții valide. Trebuie să te ferești de corelațiile false. S-ar putea să fii surprins să afli că există o corelație extrem de puternică între rata divorțurilor din Maine și consumul de margarină pe cap de locuitor. Cu toate acestea, utilizarea datelor despre divorț din Maine nu ar avea sens dacă ați încerca să preziceți vânzările viitoare de margarină.
Un exemplu real de evaluare imobiliară prin regresie
Să aplicăm acum aceste cunoștințe în mod practic și să construim un model liniar de la început până la sfârșit. Pentru exemplul nostru, vom încerca să construim un model de evaluare a proprietății imobiliare care prezice valoarea caselor unifamiliale decomandate din Comitatul Alleghany, Pennsylvania. Alegerea județului Alleghany este arbitrară, iar directorii demonstrati vor funcționa pentru orice locație. Vom folosi Excel și SPSS, care este un software de statistică folosit în mod obișnuit.
Găsirea datelor
Găsirea datelor de calitate este primul pas în construirea unui model precis și poate cel mai important. Deși am auzit cu toții expresia „gunoi în, gunoi afară”, este important să ne amintim că nu există un set de date perfect. Acest lucru este în regulă atâta timp cât putem presupune confortabil că datele eșantionului sunt reprezentative pentru întreaga populație. Există trei surse principale de date imobiliare:
- Prima și adesea cea mai bună sursă de date provine de la agențiile guvernamentale. O mare parte din aceste date sunt fie gratuite, fie cu costuri relativ reduse. Multe companii vă vor taxa pentru datele pe care le puteți obține cu ușurință gratuit, așa că aruncați întotdeauna o privire rapidă pe internet înainte de a cumpăra date. O căutare pe web va aduce adesea rezultate prin căutarea județului sau orașului pe care îl căutați și cuvinte precum „evaluator fiscal”, „evaluări fiscale”, „înregistrări imobiliare” sau „căutare act”. Departamentele de Sisteme Informaționale Geografice (GIS) sunt una dintre părțile cele mai trecute cu vederea din multe comunități. Ei au adesea o mare parte din datele agregate de la diverse alte agenții locale. În calitate de dezvoltator imobiliar, m-am bazat adesea pe ajutorul lor pentru a găsi date de înaltă calitate pe care le-am folosit pentru a construi modele care să ajute la localizarea de noi proprietăți pentru dezvoltare. Organizațiile de dezvoltare economică pot fi, de asemenea, o sursă excelentă de date.
- Furnizorii cu scop profit sunt o altă opțiune. Ele sunt deosebit de utile atunci când căutați date în mai multe zone. Asigurați-vă că vă faceți temele înainte de a plăti sume mari de bani pentru datele lor. Nu vă bazați doar pe seturile lor de date eșantion, deoarece ar putea induce în eroare în ceea ce privește caracterul complet. Dacă aveți îndoieli cu privire la datele pe care le au disponibile, contactați-vă direct cu un reprezentant sau întrebați despre o garanție de rambursare a banilor.
- În cele din urmă, serviciile locale de listări multiple (MLS) sunt o resursă de neprețuit. Cele mai multe proprietăți sunt comercializate prin intermediul unui agent imobiliar care este membru al unui MLS. În general, membrii unui MLS sunt obligați să-și pună toate listele în sistemul local. Din păcate, există adesea multe restricții privind aderarea la un MLS, iar costul accesului la date poate fi destul de mare. De asemenea, este important să vă asigurați că nu încălcați termenii și condițiile atunci când utilizați datele lor și vă expuneți la potențialele răspunderi.
Vom folosi exclusiv date gratuite pentru exemplul nostru, provenite de la Centrul Regional de Date Western Pennsylvania și Biroul de Recensământ al SUA. Datele Alleghany Real Estate Sales ne vor oferi un fișier de bază pentru observațiile noastre, cu prețul de vânzare ca variabilă dependentă (variabilă Y). De asemenea, vom testa variabile folosind scorul de mers pe jos pentru fiecare tract de recensământ și informațiile de evaluare fiscală.

O variabilă foarte utilă de avut atunci când construiești modele imobiliare este latitudinea și longitudinea fiecărei adrese. Puteți obține aceste date printr-un geocoder care utilizează o adresă de stradă pentru a atribui o latitudine și longitudine. Geocoderul Biroului de Recensământ din SUA va identifica, de asemenea, tractul de recensământ pentru fiecare locație, care este folosit în mod obișnuit pentru a agrega informații demografice și psihografice.
Analizarea, transformarea și crearea de noi variabile.
Acum că ne-am selectat sursele de date, trebuie să examinăm calitatea datelor. Cel mai simplu mod de a verifica calitatea datelor este să rulați un tabel de frecvență pentru câteva variabile cheie. Dacă există un număr semnificativ de intrări lipsă sau corupte, va trebui să examinăm datele în continuare. Tabelul de mai jos arată că numai 1 din 216.498 de înregistrări are un cod poștal lipsă în fișierul de vânzări și nu există coduri poștale eronate, cum ar fi 99999 sau 1X#45. Acest lucru indică probabil că acesta este un set de date de înaltă calitate.
Un dicționar de date este o resursă excelentă atunci când este disponibil. Acesta va oferi o descriere a ceea ce măsoară fiecare variabilă și opțiuni posibile pentru variabilă. Datele noastre conțin o analiză a fiecărei vânzări efectuate în județ. Acestea sunt informații cheie, mai ales atunci când lucrați cu înregistrări de fapte brute. Toate tranzacțiile imobiliare trebuie să fie înregistrate pentru a fi aplicabile prin lege, dar nu toate transferurile reflectă adevărata valoare justă de piață a unei proprietăți. De exemplu, o vânzare între doi membri ai familiei ar putea fi la un preț mai mic de piață ca formă de cadou sau pentru a evita plata unor costuri de tranzacție mai mari, cum ar fi ștampile de act. Din fericire pentru noi, administrația locală marchează în mod clar transferurile pe care le consideră că nu sunt reprezentative pentru valorile actuale de piață, așa că vom folosi doar înregistrări care reflectă o „vânzare validă”. Aceste vânzări reprezintă doar aproximativ 18% din numărul total de tranzacții, ilustrând cât de important este să înțelegeți datele dumneavoastră înainte de a începe să le utilizați pentru analiză. Pe baza experienței mele, acest raport este destul de comun atunci când se analizează înregistrările actelor. Este foarte probabil ca dacă am construi un model care să includă „vânzările invalide” rezultatele noastre finale ar fi distorsionate.
În continuare, vom atașa datele noastre de evaluare și scorurile de mers în fișierul de vânzări. Acest lucru ne oferă un singur tabel de utilizat pentru modelul nostru. În acest moment, trebuie să analizăm variabilele pentru a vedea dacă sunt adecvate pentru regresia liniară. Mai jos este un tabel care prezintă diferite tipuri de variabile.
Fișierul nostru conține mai multe valori nominale, cum ar fi vecinătatea sau codul poștal, care clasifică datele fără sens de ordine. Valorile nominale sunt nepotrivite pentru regresia liniară fără transformare. Există, de asemenea, mai multe variabile ordinale care gradează calitatea construcției, starea actuală a proprietății etc. Utilizarea datelor ordinale este adecvată numai atunci când putem presupune în mod rezonabil că fiecare rang este distanțat uniform. De exemplu, datele noastre au o variabilă de calificare cu 19 clasificări diferite (A+, A, A- etc.), așa că putem presupune cu siguranță că aceste note sunt probabil distanțate uniform.
Există, de asemenea, mai multe variabile care trebuie transformate înainte de a le putea folosi în model. O valoare nominală care poate fi transformată într-o variabilă inactivă pentru testare este variabila încălzire și răcire. Vom seta variabila la 0 pentru toate proprietățile fără aer condiționat și pentru cele cu aer condiționat la 1. De asemenea, notele de litere trebuie convertite în numere (de ex. 0=Cel mai rău, 1=Mai bun, 2=Cel mai bun) pentru a vedea dacă există o relaţie liniară cu preţul.
În cele din urmă, trebuie să determinăm dacă este adecvat să folosim toate observațiile. Dorim să prezicem valorile caselor unifamiliale decomandate, astfel încât să putem elimina toate proprietățile comerciale, condominiile și casele oraș din date. De asemenea, dorim să evităm potențialele probleme cu autocorelarea, așa că folosim date numai pentru vânzări în 2017 pentru a limita probabilitatea ca acest lucru să apară. După ce am eliminat toate înregistrările străine, avem setul nostru final de date pentru a fi testat.
Selecția eșantionului și a variabilelor
Selectarea dimensiunii corecte a eșantionului poate fi dificilă. Printre materialele academice, există o gamă largă de numere minime sugerate și diverse reguli de bază. Pentru studiul nostru, populația totală este destul de mare, așa că nu trebuie să ne facem griji că avem suficient pentru un eșantion. În schimb, riscăm să avem un eșantion atât de mare încât aproape fiecare variabilă va avea o semnificație statistică în model. În cele din urmă, aproximativ 10% dintre înregistrări au fost selectate aleatoriu pentru modelare.
Selecția variabilei poate fi una dintre cele mai dificile părți ale procesului fără software statistic. Cu toate acestea, SPSS ne permite să construim rapid multe modele dintr-o combinație de variabile pe care am considerat-o adecvată pentru o regresie liniară. SPSS va filtra automat variabilele pe baza pragurilor noastre pentru semnificația statistică și va returna doar cele mai bune modele.
Construirea modelului și revizuirea rezultatelor
Din datele noastre eșantion, SPSS a produs cinci modele. Modelul care a fost cel mai predictiv a inclus următoarele 5 variabile.
- Nota bazată pe calitatea construcției, clasată de la 1 la 19 (1 = Foarte slab și 19 = Excelent)
- Suprafata de locuit finisata
- Aer condiționat (Da/Nu)
- Mărimea lotului
- Nota pentru condiția fizică sau starea de reparație clasată 1-8 (1=Nelocuit și 8=excelent)
Să aruncăm o privire la rezultatele de la SPSS. Accentul nostru principal va fi inițial pe valoarea R pătrat, care ne spune ce procent de varianță a variabilei dependente (prețul) este prezis de regresie. Cea mai bună valoare posibilă ar fi 1, iar rezultatul modelului nostru este destul de promițător. Eroarea standard a estimării care măsoară precizia modelului pare a fi destul de mare la 73.091 USD. Cu toate acestea, dacă comparăm asta cu abaterea standard a prețului de vânzare din model (160.429 USD), eroarea pare rezonabilă.
SPSS are o funcționalitate încorporată pentru a testa autocorelarea utilizând testul Durbin-Watson. În mod ideal, valoarea ar fi 2,0 pe o scară de la 0 la 4, dar o valoare de 1,652 nu ar trebui să provoace alarmă.
Apoi, testăm rezultatele modelului pentru a determina dacă există vreo dovadă de heteroscedasticitate. Nu există o funcționalitate încorporată pentru SPSS, dar folosind această macrocomandă scrisă de Ahmad Daryanto putem folosi testele Breusch-Pagan și Koenker. Aceste teste arată că există heteroscedasticitate prezentă în modelul nostru, deoarece nivelul de semnificație (Sig) din graficul de mai jos este sub .005. Modelul nostru a încălcat una dintre ipotezele clasice ale regresiei liniare. Cel mai probabil, una dintre variabilele din model trebuie să fie transformată pentru a elimina problema. Cu toate acestea, înainte de a face acest lucru, este o idee bună să vedem care sunt efectele heteroscedasticității asupra puterii predictive a variabilelor noastre independente. Prin utilizarea unei macrocomenzi dezvoltate de Andrew F. Hayes, putem analiza erorile standard ajustate și nivelurile de semnificație pentru variabilele noastre independente.
Testări ulterioare arată că variabilele independente rămân semnificative din punct de vedere statistic, după luarea în considerare a heteroscedasticității în model, așa că nu trebuie neapărat să o modificăm pentru moment.
Testați și perfecționați modelul
Ca test final, vom nota toate înregistrările de vânzări care nu au făcut parte din eșantionul original cu modelul nostru. Acest lucru ne va ajuta să vedem cum funcționează modelul pe un set mai mare de date. Rezultatele acestui test arată că valoarea R-pătrat și eroarea standard a estimării nu s-au modificat semnificativ pe setul mare de date, ceea ce indică probabil că modelul nostru va funcționa conform așteptărilor.
Dacă am dori să folosim modelul nostru exemplu în viața reală, probabil am segmenta în continuare datele pentru a avea mai multe modele mai precise sau am căuta date suplimentare pentru a îmbunătăți precizia acestui singur model. Acești pași ar elimina probabil și heteroscedasticitatea pe care am văzut-o prezentă în model. Pe baza faptului că am încercat să folosim un singur model pentru a estima valoarea caselor dintr-un județ cu peste 1 milion de locuitori, nu ar trebui să fie surprinzător că nu am reușit să construim modelul „perfect” în doar câteva ore. .
Concluzii
Scopul nostru a fost să construim un model care prezice valoarea caselor unifamiliale decomandate. Analiza noastră arată că am îndeplinit acest obiectiv cu o precizie rezonabilă, dar are sens modelul nostru?
Dacă ar fi să ne descriem modelul, am spune că valoarea unei case depinde de mărimea lotului, de metru pătrat al casei, de calitatea construcției, de starea actuală de reparație și de dacă are sau nu. aer conditionat. Acest lucru pare foarte rezonabil. De fapt, dacă ne comparăm modelul cu metodele tradiționale de evaluare, vedem că este foarte asemănător cu abordarea prin cost, la care se adaugă costul de achiziție a terenului și construirea unei noi clădiri ajustate pentru starea actuală de uzură. Cu toate acestea, această similitudine ar putea fi, pentru a folosi o expresie de regresie, o corelație falsă.
De obicei, abordarea costurilor este recomandată doar pentru evaluarea proprietăților mai noi, din cauza problemelor legate de determinarea metodei adecvate de amortizare a proprietăților mai vechi. Cu modelul nostru, am creat o strategie similară care este utilă pentru proprietățile de orice vârstă, de fapt, am testat vârsta ca o variabilă independentă și am ajuns la concluzia că nu are un impact semnificativ statistic asupra valorii proprietăților!
Utilizarea analizei de regresie pentru afacerea dvs
Sperăm că, până acum, aveți o mai bună înțelegere a elementelor de bază ale analizei de regresie. Următoarea întrebare este: vă poate ajuta afacerea? Dacă răspundeți da la oricare dintre aceste întrebări, atunci probabil că ați putea beneficia de utilizarea analizei de regresie ca instrument.
- Doriți o abordare mai științifică pentru a determina valoarea, a face proiecții sau a analiza o anumită piață?
- Căutați modalități mai bune de a identifica potențialele investiții imobiliare în zone mari, regiuni sau chiar la nivel național?
- Scopul dvs. este de a atrage mari retaileri, restaurante sau companii de ospitalitate pentru proiectul dvs. imobiliar comercial?
- Credeți că vă puteți îmbunătăți procesul de luare a deciziilor prin încorporarea de noi puncte de date în proces?
- Ești îngrijorat de rentabilitatea investiției tale în marketing pentru cumpărători și investitori?
Exemplul de model de mai sus este o demonstrație simplă a valorii utilizării modelării regresiei în domeniul imobiliar. Cele 2-3 ore necesare pentru a colecta datele și a construi modelul sunt departe de a-și arăta întregul potențial. În practică, există o mare varietate de utilizări pentru analiza regresiei în industria imobiliară dincolo de evaluarea proprietății, inclusiv:
- Analiza prețurilor pentru prețurile de listă și tarifele de închiriere
- Analiza demografică și psihologică a cumpărătorilor și chiriașilor de locuințe.
- Identificarea tintelor pentru marketing direct
- Analiza ROI pentru campanii de marketing
Modelarea geospațială folosește principiile analizei de regresie asociate cu cele mai importante trei lucruri din domeniul imobiliar: locație, locație, locație. Lucrând ca dezvoltator rezidențial timp de opt ani, pot atesta puterea modelării geospațiale. Folosind ArcGIS, am reușit să încorporez date de vânzări, hărți de parcele și date lidar pentru a găsi proprietăți care erau ideale pentru dezvoltare în munții din Carolina de Nord.
Pe baza experienței mele, cei mai mulți bani din imobiliare se fac în achiziție și nu în dezvoltarea unui proiect. A fi capabil să identifice oportunitățile pe care alții le rate poate fi un avantaj competitiv extraordinar în domeniul imobiliar. Analiza geospațială este ceva de care companiile mari au profitat de mulți ani, dar companiile mai mici le trec adesea cu vederea.
Cum să identificați partenerul de analiză potrivit pentru afacerea dvs
Foarte puțini oameni ar evalua statistica ca subiectul lor preferat. De fapt, în ansamblu, oamenii sunt foarte prost în înțelegerea probabilităților de bază. Dacă aveți îndoieli cu privire la această părere, faceți o excursie la Las Vegas sau Macao. Din păcate, acest lucru poate face dificilă determinarea în cine să aveți încredere atunci când căutați sfaturi privind implementarea analizei de regresie în procesul dumneavoastră. Iată câteva lucruri cheie pe care trebuie să le căutați atunci când evaluați potențialii candidați
În timp ce oamenii sunt răi în a judeca probabilitățile, intuiția este de fapt destul de bună la a detecta minciunile. Ar trebui să fii foarte sceptic față de oricine pretinde că poate construi un model care să răspundă la toate întrebările tale! Nu aveți încredere într-o garanție a rezultatelor. Sperăm că acest articol a ilustrat faptul că analiza regresiei se bazează pe observație empirică și știință solidă. Întotdeauna se va întâmpla că anumite lucruri sunt mai ușor de prezis decât altele. Un consilier de încredere va fi deschis și cinstit atunci când nu poate găsi răspunsurile pe care le căutați și nu va trece prin bugetul dvs. încercând să găsească unul care nu există.
Caută-l pe domnul Spock în loc de căpitanul Kirk. Cercetarea solidă poate fi un instrument de marketing excelent, dar mult prea des oamenii plătesc pentru materiale de marketing sexy cu o pufă de pseudo-cercetare și fără o logică care să o susțină. Unii oameni sunt în mod natural mai analitici, dar abilități mari de analiză provin din practică. În mod ideal, oricine pe care îl angajați pentru a analiza datele pentru afacerea dvs. va avea experiență în găsirea de soluții la o mare varietate de probleme. Cineva cu un focus restrâns poate fi mai susceptibil la gândirea de grup, mai ales atunci când experiențele lor o reflectă îndeaproape pe ale tale.
Put potential candidates on the spot with questions that help demonstrate their reasoning abilities. This is not the time to rely on behavioral questions alone. Ideal candidates will have the ability to strategically use known information to reasonably estimate the answer to complex problems. Ask logical reasoning questions, like “How many tennis balls could you fit in the Empire State Building?”
Finally, you should look for someone with whom you can communicate. All of the information in the world won't help if you can't put it to good use. If someone uses so much jargon in an introductory conversation that your eyes start to glaze over, then they probably aren't the right fit for your company.