Immobilienbewertung mit Regressionsanalyse – Ein Tutorial

Veröffentlicht: 2022-03-11

Zusammenfassung

Die Regressionsanalyse bietet einen wissenschaftlicheren Ansatz für die Immobilienbewertung
  • Traditionell gibt es drei Ansätze zur Bewertung von Immobilien: vergleichbare Verkäufe, Einnahmen und Kosten.
  • Regressionsmodelle bieten eine flexiblere und objektivere Alternative. Es ist auch ein Prozess, der nach der Erstellung eines Modells autonom wird, sodass sich Immobilienunternehmer auf ihre Kernkompetenzen konzentrieren können.
  • Ein Modell kann mit zahlreichen Variablen erstellt werden, die auf Auswirkungen auf den Wert einer Immobilie getestet werden, wie z. B. Quadratmeterzahl und Anzahl der Schlafzimmer.
  • Regressionen sind kein Wundermittel. Es besteht immer die Gefahr, dass Variablen Autokorrelation und/oder Multikollinearität enthalten oder dass die Korrelation zwischen Variablen falsch ist.
Beispiel: Erstellen eines Regressionsbewertungsmodells für Allegheny County, Pennsylvania
  • Es gibt eine Fülle von Immobilieninformationen, auf die elektronisch zugegriffen werden kann, um sie in Modelle einzugeben. Regierungsbehörden, professionelle Datenanbieter und Multiple Listing Services sind drei solcher Quellen.
  • Anfängliche Datendumps erfordern eine gewisse Bereinigung, um sicherzustellen, dass keine unregelmäßigen Informationssätze vorhanden sind. Beispielsweise wurden in unserer Stichprobe Häuser, die als Geschenk übertragen wurden, entfernt, um die Ergebnisse des angemessenen Marktwerts nicht zu verzerren.
  • Unter Verwendung einer Zufallsstichprobe aus 10 % der Daten gab SPSS die folgenden fünf Variablen zurück, die den Immobilienwert am besten vorhersagen:
    • Note basierend auf der Bauqualität von 1 bis 19 (1 = sehr schlecht und 19 = ausgezeichnet)
    • Fertiger Wohnbereich
    • Klimaanlage (Ja/Nein)
    • Losgröße
    • Note für die körperliche Verfassung oder den Reparaturzustand von 1 bis 8
  • Das Testen der Ergebnisse ist entscheidend, wobei der Durbin-Watson-Test für die Autokorrelation und der Breusch-Pagan-Test für Heteroskedastizität verwendet werden. In unserem Modell gab es leichte heteroskedastische Tendenzen, was darauf hindeutet, dass die Variabilität einiger Variablen über den gesamten Wertebereich hinweg ungleich war.
Kann eine regressionsbasierte Immobilienanalyse für Ihr Unternehmen nützlich sein?
  • Neben der Bewertung von Immobilien kann die Regressionsanalyse innerhalb von Immobilien auch in anderen Bereichen von Vorteil sein:
    • Testen der Rückgabeleistung bei vergangenen Geschäften
    • Preisanalyse für Listenpreise und Mietpreise
    • Demografische und psychografische Analyse von Wohnungskäufern und -mietern
    • Identifizieren von Zielen für Direktmarketing
    • ROI-Analyse für Marketingkampagnen
  • Seien Sie außerdem bei der Beurteilung von Kandidaten für die Erstellung von Regressionsmodellen vorsichtig mit denen, die vom ersten Tag an die Welt versprechen. Der Aufbau eines robusten Regressionsmodells ist ein iterativer Prozess. Konzentrieren Sie sich also stattdessen auf diejenigen, die von Natur aus neugierig sind und sofort denken können (dh Denkaufgaben mit einem Denkprozess beantworten können).

Allzu oft kann der Bewertungsprozess bei Immobilien wie ein anspruchsvolles Daumenlutschen wirken. Der Makler wird vorbeikommen, die sprichwörtlichen Reifen treten und dann einen geschätzten Wert mit sehr wenig „quantitativem“ Einblick erstellen. Vielleicht wird der Prozess durch die emotionale Bindung verschärft, die der Besitz von Immobilien mit sich bringt, da ein Haus für viele die größte finanzielle Investition ihres Lebens ist.

Doch dieser Wahnsinn hat Methode. Nun, drei um genau zu sein.

Wie wird eine Immobilie bewertet?

Der vergleichbare Verkaufsansatz ist bei Wohnimmobilien am gebräuchlichsten und verwendet kürzliche Verkäufe ähnlicher Immobilien, um den Wert einer betreffenden Immobilie zu bestimmen. Der Verkaufspreis der „Comps“ wird basierend auf den Unterschieden zwischen ihnen und der betreffenden Immobilie angepasst. Wenn beispielsweise eine vergleichbare Immobilie ein zusätzliches Badezimmer hat, wird der geschätzte Wert des Badezimmers von seinem beobachteten Verkaufspreis abgezogen.

Gewerbeimmobilien gelten als heterogener, daher wird der vergleichbare Verkaufsansatz seltener verwendet. Der Einkommensansatz, der auf dem Konzept basiert, dass der innere Wert eines Vermögenswerts der Summe aller seiner diskontierten Cashflows entspricht, wird häufiger auf zwei Methoden angewendet:

  1. Ähnlich wie der Barwert einer Annuität verwendet die direkte Kapitalisierungsmethode das Nettobetriebsergebnis (NOI) einer Immobilie dividiert durch die „Cap Rate“, um einen Wert zu ermitteln. Der Cap-Satz enthält einen implizierten Abzinsungssatz und eine zukünftige Wachstumsrate des Nettobetriebsgewinns.
  2. Die Discounted-Cashflow-Methode liefert den Barwert zukünftiger Cashflows über einen festgelegten Zeitraum mit einem Endwert, der anhand einer Endkapitalisierungsrate geschätzt wird.

Die letzte Technik ist der Kostenansatz, der den Wert auf der Grundlage der Kosten für den Erwerb eines identischen Grundstücks und den Bau einer Nachbildung des betreffenden Grundstücks schätzt. Dann werden die Kosten des Projekts basierend auf dem aktuellen Stand der Veralterung der betreffenden Immobilie abgeschrieben. Ähnlich wie bei den Anpassungen im vergleichbaren Verkaufsansatz ist das Ziel, das betreffende Objekt möglichst genau abzugleichen. Der Kostenansatz wird seltener verwendet als die beiden anderen Ansätze.

Alle traditionellen Immobilienbewertungsmethoden sind aufgrund der Auswahl der für die Bewertung verwendeten Inputs subjektiv. Beispielsweise hat die Wahl des Cap-Satzes einen erheblichen Einfluss auf die Immobilienbewertung: Bei der Bewertung einer Immobilie mit einem NOI von 1 Mio. USD führt eine Erhöhung des Cap-Satzes um 4 % (von 6 % auf 10 %) zu einer Wertminderung der Liegenschaft um 40 % (Grafik unten).

Cap Rate wirkt sich überproportional auf die Immobilienbewertung aus

Vorteile der Verwendung von Regressionsmodellen in der Immobilienbewertung

Die Verwendung von Regressionsmodellen für die Immobilienbewertung bietet zahlreiche Vorteile. Die Einzelhandelsbranche hat seine Verwendung für die Standortauswahl begrüßt, aber die Immobilienbranche hat größtenteils ihre potenziellen Vorteile übersehen. Die Regressionsanalyse eignet sich besonders für die Analyse großer Datenmengen. Es wäre praktisch unmöglich, alle lokalen Immobilienmärkte des Landes genau zu kennen, aber die Regressionsmodellierung kann helfen, die Suche einzugrenzen.

1. Flexibilität

Der größte Vorteil der Verwendung von Regressionsmodellen ist ihre inhärente Flexibilität – sie können unabhängig von anderen Modellen oder gemeinsam mit ihnen arbeiten.

Der direkteste Ansatz besteht darin, vorhandene Verkaufsdaten zu verwenden, um den Wert einer betreffenden Immobilie als Ausgabe für das Modell vorherzusagen. Es gibt zahlreiche Quellen für kostenlose Daten von Kommunal-, Landes- und Bundesbehörden, die durch private Datenanbieter ergänzt werden können.

Eine weitere Option besteht darin, Regressionsmodelle zu verwenden, um Eingaben für andere traditionelle Bewertungsmethoden genauer vorherzusagen. Bei der Analyse eines kommerziellen Projekts mit gemischter Nutzung könnte ein Entwickler beispielsweise ein Modell erstellen, um die Verkäufe pro Quadratfuß für die Einzelhandelsfläche vorherzusagen, und ein anderes Modell, um die Mietpreise für die Wohnkomponente vorherzusagen. Beides könnte dann als Input für einen Einkommensansatz zur Bewertung verwendet werden.

2. Objektiver Ansatz

Die Verwendung solider statistischer Prinzipien führt zu einem objektiveren Bewertungsansatz. Dies ist eine der besten Möglichkeiten, um Bestätigungsverzerrungen zu vermeiden, die auftreten, wenn Menschen nach Informationen suchen, die ihre bereits bestehende Meinung bestätigen, oder neue Informationen ablehnen, die ihr widersprechen. Wenn ich Modelle für Einzelhändler erstellt habe, um die Verkäufe neuer Geschäfte vorherzusagen, waren sie oft überrascht zu erfahren, dass viele Einzelhändler davon profitieren, in der Nähe eines Konkurrenten zu sein. Tatsächlich war die Kollokation mit Walmart, der oft ihr größter Konkurrent war, eine der am häufigsten verwendeten Variablen in meinen Modellen. Sich auf vorhandene Vorurteile zu verlassen, kann dazu führen, dass Chancen verpasst werden, oder noch schlimmer, Katastrophen gleich um die Ecke verbergen.

Einige der objektiven Vorteile der statistischen Bewertung sind die folgenden:

  1. Mit der statistischen Analyse können Sie die statistische Signifikanz (Zuverlässigkeit) einzelner Faktoren im Modell bestimmen.
  2. Während die Szenario- oder Sensitivitätsanalyse Ihnen bei traditionelleren Methoden eine allgemeine Vorstellung von Änderungen an Eingaben geben kann, ähnelt sie eher dem Erstellen mehrerer Vorhersagen, als Ihnen eine bessere Vorstellung von der Genauigkeit der ursprünglichen Vorhersage zu geben. Auf der anderen Seite wissen Sie beim Erstellen eines Regressionsmodells, welche Ergebnisspanne auf einem bestimmten Konfidenzniveau basiert.

Regressionsmodelle sind insofern einzigartig, als sie über eine eingebaute Genauigkeitsprüfung verfügen. Nachdem Sie ein Modell für eine Stichprobe der Gesamtpopulation erstellt haben, können Sie das Modell für Out-of-Sample-Daten verwenden, um mögliche Stichprobenverzerrungen zu erkennen.

3. Bleiben Sie bei Ihrer Kernkompetenz

Traditionelle Bewertungsmethoden bergen alle ein erhebliches Risiko von Auswahlverzerrungen. Bei der Auswahl vergleichbarer Objekte kann man leicht in die Falle tappen, die besten Ergebnisse auszuwählen und davon auszugehen, dass sie Ihrem Projekt am ähnlichsten sind. Ein weiterer Schwerpunkt liegt auf der Vorhersage von Variablen, wie z. B. der Rendite im Einkommensansatz. Der Verzicht auf diese Prognose könnte für viele Immobilieninvestoren attraktiv sein, weshalb die regressionsbasierte Bewertung ein sinnvoller Ansatz ist.

Mögliche Probleme bei der Regressionsanalyse

Die Menge an Witzen, die die unterschiedlichen Prozentsätze von Statistiken zitieren, die sich ausmachen, ist in der Tat ein Witz an sich. Wir werden fast täglich mit Schlagzeilen in den Medien über die Ergebnisse einer neuen Forschungsstudie bombardiert, von denen viele einer im letzten Jahr veröffentlichten Studie zu widersprechen scheinen. In einer Welt der Soundbites bleibt keine Zeit, die Strenge der von den Forschern angewandten Methoden zu diskutieren.

Es gibt viele Arten von Regressionsanalysen, aber die häufigste ist die lineare Regression. Es gibt bestimmte Annahmen zu linearen Regressionen, die nicht verletzt werden sollten, um das Modell als gültig zu betrachten. Ein Verstoß gegen diese Annahmen verzerrt statistische Tests zur Berechnung der Vorhersagekraft der Eingaben und des Gesamtmodells.

Lineare Regressionsannahmen

Es sollte eine lineare Beziehung zwischen den Eingaben (unabhängige Variablen) und der Ausgabe (abhängige Variable) bestehen. Zum Beispiel könnten wir annehmen, dass es eine lineare Beziehung zwischen den beheizten Quadratmetern in einem Haus und seinem Gesamtwert gibt. Aufgrund sinkender Renditen konnten wir jedoch feststellen, dass die Beziehung nicht linear ist und eine Transformation der Rohdaten erforderlich macht.

Beispiel für lineare und nichtlineare Beziehungsregression

Die unabhängigen Variablen sollten nicht zufällig sein. Einfach ausgedrückt, die Beobachtungen für jede unabhängige Variable im Modell sind fest und es wird angenommen, dass sie keinen Fehler in ihrer Messung aufweisen. Wenn wir beispielsweise die Anzahl der Einheiten verwenden, um den Wert eines Mehrfamilienhauses zu modellieren, haben alle Gebäude in unseren Beispieldaten eine feste Anzahl von Einheiten, die sich nicht ändern, unabhängig davon, wie wir das Modell erstellen.

Die „Residuen“ des Modells (dh die Differenz zwischen dem vorhergesagten Ergebnis des Modells und den tatsächlichen Beobachtungen) summieren sich zu 0 oder einfacher ausgedrückt: Das von uns verwendete Modell repräsentiert die Linie der besten Anpassung.

Das Modell sollte für alle Beobachtungen für jede unabhängige Variable genau sein. Wenn wir den Wert eines Hauses basierend auf seiner Quadratmeterzahl vorhersagen würden, würden wir das Modell nicht verwenden wollen, wenn es bei der Vorhersage von Werten für Häuser unter 1.500 Quadratfuß extrem genau wäre, aber es eine große Fehlerquote für Häuser über 3.000 gäbe Quadratfuß. Dies wird als Heteroskedastizität bezeichnet.

Beispiel für Heteroskedastizität und Homoskedastizität

Eines der häufigsten Probleme bei der linearen Regression bei der Betrachtung der Immobilienbranche ist eine Korrelation von Restfehlern zwischen Beobachtungen. Sie können sich dies als weißes Rauschen vorstellen, das kein Muster hat. Wenn die Residuen jedoch ein Muster aufweisen, müssen wir höchstwahrscheinlich eine Anpassung vornehmen. Dieses Problem ist schwer zu fassen, aber es gibt zwei Hauptbereiche, in denen dies in der Immobilienbranche ein Problem darstellt.

1. Autokorrelation

Die Erstellung eines Modells auf der Grundlage von Beobachtungen über einen langen Zeitraum wäre für die Vorhersage aktueller Werte ungeeignet. Angenommen, wir haben ein Modell erstellt, um den Wert einer Hotelimmobilie anhand des durchschnittlichen Zimmerpreises als unabhängige Variable vorherzusagen. Die Vorhersagekraft dieser Variablen könnte irreführend sein, da die Zimmerpreise im Laufe der Zeit stetig gestiegen sind. Statistisch gesehen gibt es eine Autokorrelation zwischen den beobachteten durchschnittlichen Zimmerpreisen, die einen positiven Trend über die Zeit (dh Inflation) zeigen, der im Modell nicht berücksichtigt würde. Der traditionelle vergleichbare Verkaufsansatz, der bei Wohnimmobilien am weitesten verbreitet ist, beseitigt dieses Problem, indem nur die neuesten Daten verwendet werden. Da es sich um weitaus weniger Handelsgeschäfte handelt, macht diese zeitliche Beschränkung den vergleichbaren Verkaufsansatz oft unwirksam. Es gibt jedoch Techniken, die eine lineare Regression verwenden, die die Probleme der Autokorrelation überwinden können.

Der Clustereffekt ist auch eine große Herausforderung bei der Modellierung der Immobilienbewertung. Dies kann als räumliche Autokorrelation betrachtet werden. Die einfachste Art, sich dieses Problem vorzustellen, besteht darin, sich vorzustellen, ein Modell zu erstellen, um den Wert von Häusern in zwei Stadtteilen (A und B) auf beiden Seiten einer Autobahn vorherzusagen. Insgesamt kann das Modell bei der Vorhersage von Werten gut funktionieren, aber wenn wir die Restfehler untersuchen, stellen wir fest, dass es ein Muster gibt. Die Häuser in Stadtteil A sind im Allgemeinen um etwa 10 % überbewertet, und die Häuser in Stadtteil B sind etwa 10 % unterbewertet. Um unser Modell zu verbessern, müssen wir diesen Clustereffekt berücksichtigen oder ein Modell für jede Nachbarschaft erstellen.

2. Multikollinearität

Idealerweise werden Variablen innerhalb eines Modells nicht miteinander korreliert. Dieses bekannte Problem wird als Multikollinearität bezeichnet. Die Verwendung von sowohl Quadratfuß als auch der Anzahl der Parkplätze als Eingaben für ein Modell zur Bewertung regionaler Einkaufszentren würde wahrscheinlich Multikollinearität demonstrieren. Dies ist intuitiv, da Planungscodes häufig eine bestimmte Anzahl von Parkplätzen basierend auf der Quadratmeterzahl einer Gewerbefläche erfordern. In diesem Beispiel würde das Entfernen einer der Variablen eine genauere Bewertung des angepassten Modells ergeben, ohne seine Vorhersagekraft wesentlich zu verringern.

Andere Überlegungen

Die Verwendung von beobachteten Daten ist der Kern jedes empirischen Ansatzes, aber es ist wichtig, sich daran zu erinnern, dass vergangene Ergebnisse nicht immer die Zukunft vorhersagen. Illiquide Vermögenswerte wie Immobilien sind besonders anfällig für Veränderungen im Konjunkturzyklus. Die Vorhersagekraft bestimmter Variablen wird sich wahrscheinlich aufgrund der aktuellen wirtschaftlichen Bedingungen ändern. Dieses Problem tritt nicht nur bei der linearen Regression auf, sondern tritt auch bei herkömmlichen Ansätzen auf.

Korrelation ist nicht gleich Kausalität. Der Zweck der Modellerstellung besteht darin, nützliche Variablen zu finden, die gültige Vorhersagen treffen. Sie müssen sich vor falschen Korrelationen in Acht nehmen. Sie werden überrascht sein zu erfahren, dass es eine extrem starke Korrelation zwischen der Scheidungsrate in Maine und dem Pro-Kopf-Verbrauch von Margarine gibt. Die Verwendung von Scheidungsdaten aus Maine wäre jedoch nicht sinnvoll, wenn Sie versuchen würden, zukünftige Margarineverkäufe vorherzusagen.

Ein reales Beispiel für die Immobilienbewertung durch Regression

Wenden wir dieses Wissen nun praktisch an und bauen ein von Anfang bis Ende lineares Modell auf. Für unser Beispiel werden wir versuchen, ein Immobilienbewertungsmodell zu erstellen, das den Wert von freistehenden Einfamilienhäusern in Alleghany County, Pennsylvania, vorhersagt. Die Wahl von Alleghany County ist willkürlich, und die gezeigten Prinzipien funktionieren für jeden Standort. Wir werden Excel und SPSS verwenden, eine häufig verwendete Statistiksoftware.

Daten finden

Das Auffinden hochwertiger Daten ist der erste Schritt beim Erstellen eines genauen Modells und vielleicht der wichtigste. Obwohl wir alle den Ausdruck „Garbage in, Garbage out“ gehört haben, ist es wichtig, sich daran zu erinnern, dass es keinen perfekten Datensatz gibt. Dies ist in Ordnung, solange wir davon ausgehen können, dass die Stichprobendaten repräsentativ für die gesamte Bevölkerung sind. Es gibt drei Hauptquellen für Immobiliendaten:

  1. Die erste und oft beste Datenquelle kommt von Regierungsbehörden. Viele dieser Daten sind entweder kostenlos oder relativ kostengünstig. Viele Unternehmen berechnen Ihnen Daten, die Sie problemlos kostenlos erhalten könnten. Schauen Sie also immer kurz im Internet nach, bevor Sie Daten kaufen. Eine Websuche liefert oft Ergebnisse, wenn Sie nach dem gesuchten Landkreis oder der gesuchten Stadt und Wörtern wie „Steuerbeurteiler“, „Steuergutachten“, „Immobilienunterlagen“ oder „Urkundensuche“ suchen. Abteilungen für Geografische Informationssysteme (GIS) sind einer der am meisten übersehenen Bereiche vieler Gemeinden. Sie verfügen oft über einen Großteil der Daten, die von verschiedenen anderen lokalen Behörden gesammelt wurden. Als Immobilienentwickler habe ich mich oft auf ihre Hilfe verlassen, um qualitativ hochwertige Daten zu finden, die ich zum Erstellen von Modellen verwendet habe, um bei der Suche nach neuen Grundstücken für die Entwicklung zu helfen. Auch Organisationen der Wirtschaftsförderung können eine hervorragende Datenquelle sein.
  2. Eine weitere Option sind gewinnorientierte Anbieter. Sie sind besonders nützlich, wenn Sie nach Daten in mehreren Bereichen suchen. Stellen Sie sicher, dass Sie Ihre Hausaufgaben machen, bevor Sie große Summen für ihre Daten bezahlen. Verlassen Sie sich nicht nur auf ihre Beispieldatensätze, da dies hinsichtlich der Vollständigkeit irreführend sein könnte. Wenn Sie Zweifel haben, welche Daten sie zur Verfügung haben, wenden Sie sich direkt an einen Vertreter oder erkundigen Sie sich nach einer Geld-zurück-Garantie.
  3. Schließlich sind lokale Multiple Listing Services (MLS) eine unschätzbare Ressource. Die meisten Immobilien werden über einen Immobilienmakler vermarktet, der Mitglied einer MLS ist. Im Allgemeinen müssen Mitglieder eines MLS alle ihre Einträge in das lokale System eingeben. Leider gibt es oft viele Einschränkungen beim Beitritt zu einem MLS, und die Kosten für den Datenzugriff können ziemlich hoch sein. Es ist auch wichtig sicherzustellen, dass Sie nicht gegen die Nutzungsbedingungen verstoßen, wenn Sie ihre Daten verwenden, und sich einer möglichen Haftung aussetzen.

Wir werden für unser Beispiel ausschließlich kostenlose Daten verwenden, die vom Western Pennsylvania Regional Data Center und dem US Census Bureau stammen. Die Immobilienverkaufsdaten von Alleghany liefern uns eine Basisdatei für unsere Beobachtungen mit dem Verkaufspreis als unserer abhängigen Variablen (Y-Variable). Wir werden auch Variablen testen, indem wir den Walk-Score für jeden Volkszählungsbezirk und Steuerbewertungsinformationen verwenden.

Eine sehr nützliche Variable beim Erstellen von Immobilienmodellen ist der Breiten- und Längengrad jeder Adresse. Sie können diese Daten über einen Geocoder erhalten, der eine Straßenadresse verwendet, um einen Breiten- und Längengrad zuzuordnen. Der Geocoder des US Census Bureau identifiziert auch den Volkszählungsbezirk für jeden Ort, der üblicherweise verwendet wird, um demografische und psychografische Informationen zusammenzufassen.

Analysieren, Transformieren und Erstellen neuer Variablen.

Nachdem wir unsere Datenquellen ausgewählt haben, müssen wir die Qualität der Daten untersuchen. Der einfachste Weg, die Datenqualität zu überprüfen, besteht darin, eine Häufigkeitstabelle für einige Schlüsselvariablen zu erstellen. Wenn eine erhebliche Anzahl fehlender oder beschädigter Einträge vorhanden ist, müssen wir die Daten weiter untersuchen. Die folgende Tabelle zeigt, dass nur 1 von 216.498 Datensätzen eine fehlende Postleitzahl in der Verkaufsdatei aufweist und es keine fehlerhaften Postleitzahlen wie 99999 oder 1X#45 gibt. Dies deutet wahrscheinlich darauf hin, dass es sich um einen hochwertigen Datensatz handelt.

Fehlertabelle

Ein Datenwörterbuch ist eine hervorragende Ressource, sofern verfügbar. Es enthält eine Beschreibung dessen, was jede Variable misst, und mögliche Optionen für die Variable. Unsere Daten enthalten eine Analyse jedes in der Grafschaft durchgeführten Verkaufs. Dies sind wichtige Informationen, insbesondere wenn Sie mit Rohurkundendaten arbeiten. Alle Immobilientransaktionen müssen aufgezeichnet werden, um gesetzlich durchsetzbar zu sein, aber nicht alle Übertragungen spiegeln den wahren Marktwert einer Immobilie wider. Beispielsweise könnte ein Verkauf zwischen zwei Familienmitgliedern zu einem unter dem Marktpreis liegenden Preis als Geschenk erfolgen oder um höhere Transaktionskosten wie Urkundenstempel zu vermeiden. Zum Glück für uns kennzeichnet die lokale Regierung Überweisungen eindeutig, die ihrer Meinung nach nicht repräsentativ für den aktuellen Marktwert sind, sodass wir nur Aufzeichnungen verwenden, die einen „gültigen Verkauf“ widerspiegeln. Diese Verkäufe machen nur etwa 18 % der Gesamtzahl der Transaktionen aus, was zeigt, wie wichtig es ist, Ihre Daten zu verstehen, bevor Sie sie für Analysen verwenden. Nach meiner Erfahrung ist dieses Verhältnis bei der Analyse von Urkundenaufzeichnungen recht üblich. Es ist sehr wahrscheinlich, dass unsere Endergebnisse verzerrt wären, wenn wir ein Modell erstellen würden, das die „ungültigen Verkäufe“ enthält.

Als Nächstes werden wir unsere Bewertungsdaten und Gehergebnisse an die Verkaufsdatei anhängen. Dies gibt uns eine einzige Tabelle, die wir für unser Modell verwenden können. An diesem Punkt müssen wir die Variablen analysieren, um festzustellen, ob sie für die lineare Regression geeignet sind. Nachfolgend finden Sie eine Tabelle mit verschiedenen Arten von Variablen.

Variablentest für Regressionen

Unsere Datei enthält mehrere Nominalwerte wie Nachbarschaft oder Postleitzahl, die Daten ohne Ordnungssinn kategorisieren. Nominalwerte sind für eine lineare Regression ohne Transformation ungeeignet. Es gibt auch mehrere ordinale Variablen, die die Bauqualität, den aktuellen Zustand der Immobilie usw. bewerten. Die Verwendung von ordinalen Daten ist nur dann angemessen, wenn vernünftigerweise davon ausgegangen werden kann, dass jeder Rang gleichmäßig verteilt ist. Unsere Daten haben beispielsweise eine Notenvariable mit 19 verschiedenen Klassifikationen (A+, A, A- usw.), sodass wir davon ausgehen können, dass diese Noten wahrscheinlich gleichmäßig verteilt sind.

Es gibt auch mehrere Variablen, die transformiert werden müssen, bevor wir sie im Modell verwenden können. Ein Sollwert, der zum Testen in eine Dummy-Variable transformiert werden kann, ist die Heiz- und Kühlvariable. Wir setzen die Variable für alle Objekte ohne Klimaanlage auf 0 und für die mit Klimaanlage auf 1. Außerdem müssen die Buchstabennoten in Zahlen umgewandelt werden (z. B. 0 = Schlechteste, 1 = Bessere, 2 = Beste), um sie zu sehen wenn es eine lineare Beziehung zum Preis gibt.

Schließlich müssen wir bestimmen, ob es angemessen ist, alle Beobachtungen zu verwenden. Wir möchten die Werte von freistehenden Einfamilienhäusern vorhersagen, damit wir alle Gewerbeimmobilien, Eigentumswohnungen und Reihenhäuser aus den Daten eliminieren können. Wir möchten auch potenzielle Probleme mit der Autokorrelation vermeiden, daher verwenden wir nur Daten für Verkäufe im Jahr 2017, um die Wahrscheinlichkeit dieses Auftretens zu begrenzen. Nachdem wir alle irrelevanten Datensätze eliminiert haben, haben wir unseren endgültigen Datensatz zum Testen.

Stichproben- und Variablenauswahl

Die Auswahl der richtigen Stichprobengröße kann schwierig sein. Unter den akademischen Materialien gibt es eine breite Palette von empfohlenen Mindestzahlen und verschiedene Faustregeln. Für unsere Studie ist die Gesamtpopulation ziemlich groß, sodass wir uns keine Sorgen machen müssen, ob wir genug für eine Stichprobe haben. Stattdessen laufen wir Gefahr, eine so große Stichprobe zu haben, dass fast jede Variable eine statistische Signifikanz im Modell hat. Am Ende wurden etwa 10 % der Aufzeichnungen zufällig für die Modellierung ausgewählt.

Die Variablenauswahl kann ohne Statistiksoftware einer der schwierigsten Teile des Prozesses sein. Mit SPSS können wir jedoch schnell viele Modelle aus einer Kombination von Variablen erstellen, die wir für eine lineare Regression als geeignet erachten. SPSS filtert Variablen basierend auf unseren Schwellenwerten für statistische Signifikanz automatisch heraus und gibt nur die besten Modelle zurück.

Erstellen des Modells und Überprüfen der Ergebnisse

Aus unseren Beispieldaten hat SPSS fünf Modelle erstellt. Das Modell mit der besten Vorhersage enthielt die folgenden 5 Variablen.

  1. Note basierend auf der Bauqualität, Rang 1-19 (1 = sehr schlecht und 19 = ausgezeichnet)
  2. Fertiger Wohnbereich
  3. Klimaanlage (Ja/Nein)
  4. Losgröße
  5. Note für den körperlichen Zustand bzw. den Erhaltungszustand von 1-8 (1=unbewohnbar und 8=ausgezeichnet)

Schauen wir uns die Ergebnisse von SPSS an. Unser Hauptaugenmerk wird zunächst auf dem R-Quadrat-Wert liegen, der uns sagt, wie viel Prozent der Varianz in der abhängigen Variablen (Preis) durch die Regression vorhergesagt wird. Der bestmögliche Wert wäre 1, und das Ergebnis unseres Modells ist durchaus vielversprechend. Der Standardfehler der Schätzung, die die Genauigkeit des Modells misst, scheint mit 73.091 $ ziemlich hoch zu sein. Wenn wir dies jedoch mit der Standardabweichung des Verkaufspreises im Modell (160.429 $) vergleichen, erscheint der Fehler angemessen.

Regressionsausgabe 1

Modell 5 hatte einen akzeptablen Standardfehler und besteht den Durbin-Watson-Test

SPSS verfügt über eine integrierte Funktion zum Testen der Autokorrelation mithilfe des Durbin-Watson-Tests. Idealerweise wäre der Wert 2,0 auf einer Skala von 0 bis 4, aber ein Wert von 1,652 sollte keinen Alarm auslösen.

Als nächstes testen wir die Ergebnisse des Modells, um festzustellen, ob es Hinweise auf Heteroskedastizität gibt. Es gibt keine integrierte Funktionalität für SPSS, aber mit diesem von Ahmad Daryanto geschriebenen Makro können wir die Breusch-Pagan- und Koenker-Tests verwenden. Diese Tests zeigen, dass in unserem Modell Heteroskedastizität vorhanden ist, da das Signifikanzniveau (Sig) im Diagramm unten unter 0,005 liegt. Unser Modell hat eine der klassischen Annahmen der linearen Regression verletzt. Höchstwahrscheinlich muss eine der Variablen im Modell transformiert werden, um das Problem zu beseitigen. Bevor wir dies tun, ist es jedoch eine gute Idee zu sehen, welche Auswirkungen die Heteroskedastizität auf die Vorhersagekraft unserer unabhängigen Variablen hat. Durch die Verwendung eines von Andrew F. Hayes entwickelten Makros können wir uns die angepassten Standardfehler und Signifikanzniveaus für unsere unabhängigen Variablen ansehen.

Regressionsausgabe 2

Das Modell weist Heteroskedastizität auf, aber weitere Tests zeigen, dass dies die unabhängigen Variablen nicht beeinflusst

Weitere Tests zeigen, dass die unabhängigen Variablen nach Berücksichtigung der Heteroskedastizität im Modell statistisch signifikant bleiben, sodass wir es vorerst nicht unbedingt ändern müssen.

Testen und verfeinern Sie das Modell

Als abschließenden Test punkten wir mit unserem Modell alle Verkaufsrekorde, die nicht Bestandteil des Originalmusters waren. Dies hilft uns zu sehen, wie sich das Modell bei einem größeren Datensatz verhält. Die Ergebnisse dieses Tests zeigen, dass sich der R-Quadrat-Wert und der Standardfehler der Schätzung bei dem großen Datensatz nicht wesentlich geändert haben, was wahrscheinlich darauf hindeutet, dass unser Modell wie erwartet funktioniert.

Regressionsausgabe 3

Die Anwendung des Modells auf den vollständigen Datensatz zeigt die Übereinstimmung mit der Stichprobe, wobei ähnliche R-Quadrat- und Standardfehlerwerte beobachtet werden

Wenn wir unser Beispielmodell im wirklichen Leben verwenden wollten, würden wir die Daten wahrscheinlich weiter segmentieren, um mehrere genauere Modelle zu erhalten, oder nach zusätzlichen Daten suchen, um die Genauigkeit dieses einzelnen Modells zu verbessern. Diese Schritte würden wahrscheinlich auch die Heteroskedastizität beseitigen, die wir im Modell gesehen haben. Angesichts der Tatsache, dass wir versuchten, mit einem einzigen Modell den Wert von Häusern in einem Landkreis mit über 1 Million Einwohnern vorherzusagen, sollte es nicht überraschen, dass wir nicht in der Lage waren, das „perfekte“ Modell in nur wenigen Stunden zu erstellen .

Schlussfolgerungen

Unser Ziel war es, ein Modell zu bauen, das den Wert von Einfamilienhäusern vorhersagt. Unsere Analyse zeigt, dass wir dieses Ziel mit einer angemessenen Genauigkeit erreicht haben, aber ist unser Modell sinnvoll?

Wenn wir unser Modell beschreiben würden, würden wir sagen, dass der Wert eines Hauses von der Größe des Grundstücks, der Quadratmeterzahl des Hauses, der Bauqualität, dem aktuellen Reparaturzustand und davon abhängt, ob es vorhanden ist oder nicht Klimaanlage. Dies erscheint sehr vernünftig. Wenn wir unser Modell mit den traditionellen Bewertungsmethoden vergleichen, sehen wir, dass es dem Kostenansatz sehr ähnlich ist, der die Kosten für den Erwerb von Grundstücken und den Bau eines neuen Gebäudes hinzufügt, angepasst an den aktuellen Stand der Veralterung. Diese Ähnlichkeit könnte jedoch, um eine Regressionsphrase zu verwenden, eine Scheinkorrelation sein.

Typischerweise wird der Kostenansatz nur für die Bewertung neuerer Immobilien empfohlen, da es Probleme bei der Bestimmung der geeigneten Methode zur Abschreibung älterer Immobilien gibt. Mit unserem Modell haben wir eine ähnliche Strategie entwickelt, die für Immobilien jeden Alters nützlich ist. Tatsächlich haben wir das Alter als unabhängige Variable getestet und sind zu dem Schluss gekommen, dass es keinen statistisch signifikanten Einfluss auf den Immobilienwert hat!

Verwenden der Regressionsanalyse für Ihr Unternehmen

Hoffentlich haben Sie inzwischen ein besseres Verständnis für die Grundlagen der Regressionsanalyse. Die nächste Frage ist: Kann es Ihrem Unternehmen helfen? Wenn Sie eine dieser Fragen mit Ja beantworten, könnten Sie wahrscheinlich von der Verwendung der Regressionsanalyse als Werkzeug profitieren.

  1. Möchten Sie einen wissenschaftlicheren Ansatz zur Bestimmung des Werts, zur Erstellung von Prognosen oder zur Analyse eines bestimmten Marktes?
  2. Suchen Sie nach besseren Möglichkeiten, um potenzielle Immobilieninvestitionen in großen Gebieten, Regionen oder sogar landesweit zu identifizieren?
  3. Ist es Ihr Ziel, große Einzelhändler, Restaurants oder Gastgewerbeunternehmen für Ihr gewerbliches Immobilienprojekt zu gewinnen?
  4. Glauben Sie, dass Sie Ihren Entscheidungsprozess möglicherweise verbessern könnten, indem Sie neue Datenpunkte in den Prozess integrieren?
  5. Sind Sie besorgt über die Rendite Ihrer Investition in Marketing für Käufer und Investoren?

Das obige Beispielmodell ist eine einfache Demonstration des Werts der Verwendung von Regressionsmodellen in Immobilien. Die 2-3 Stunden, die es dauerte, die Daten zu sammeln und das Modell zu bauen, zeigen bei weitem nicht sein volles Potenzial. In der Praxis gibt es über die Immobilienbewertung hinaus eine Vielzahl von Anwendungen für die Regressionsanalyse in der Immobilienbranche, darunter:

  1. Preisanalyse für Listenpreise und Mietpreise
  2. Demografische und psychografische Analyse von Wohnungskäufern und -mietern.
  3. Identifizieren von Zielen für Direktmarketing
  4. ROI-Analyse für Marketingkampagnen

Geospatial Modeling nutzt die Prinzipien der Regressionsanalyse gepaart mit den drei wichtigsten Dingen bei Immobilien: Lage, Lage, Lage. Ich arbeite seit acht Jahren als Wohnentwickler und kann die Leistungsfähigkeit der Geodatenmodellierung bestätigen. Mithilfe von ArcGIS konnte ich Verkaufsdaten, Flurstückskarten und LIDAR-Daten integrieren, um Liegenschaften zu finden, die sich ideal für die Entwicklung in den Bergen von North Carolina eignen.

Nach meiner Erfahrung wird das meiste Geld bei Immobilien mit dem Erwerb und nicht mit der Entwicklung eines Projekts verdient. In der Lage zu sein, Gelegenheiten zu erkennen, die andere verpassen, kann ein enormer Wettbewerbsvorteil im Immobilienbereich sein. Geodatenanalyse ist etwas, das große Unternehmen seit vielen Jahren nutzen, aber kleinere Unternehmen übersehen es oft.

So identifizieren Sie den richtigen Analytics-Partner für Ihr Unternehmen

Die wenigsten Menschen würden Statistik als ihr Lieblingsfach bezeichnen. Tatsächlich sind die Menschen insgesamt sehr schlecht darin, selbst grundlegende Wahrscheinlichkeiten zu verstehen. Wenn Sie an dieser Meinung zweifeln, machen Sie einen Ausflug nach Las Vegas oder Macau. Leider kann dies die Entscheidung erschweren, wem Sie vertrauen können, wenn Sie nach Ratschlägen zur Implementierung der Regressionsanalyse in Ihrem Prozess suchen. Hier sind einige wichtige Dinge, auf die Sie bei der Bewertung potenzieller Kandidaten achten sollten

Während Menschen schlecht darin sind, Wahrscheinlichkeiten einzuschätzen, ist Intuition eigentlich ziemlich gut darin, Lügen zu erkennen. Sie sollten sehr skeptisch gegenüber jedem sein, der behauptet, ein Modell bauen zu können, das alle Ihre Fragen beantwortet! Vertrauen Sie keiner Ergebnisgarantie. Hoffentlich hat dieser Artikel die Tatsache veranschaulicht, dass die Regressionsanalyse auf empirischer Beobachtung und fundierter Wissenschaft basiert. Es wird immer so sein, dass bestimmte Dinge leichter vorhersehbar sind als andere. Ein vertrauenswürdiger Berater wird offen und ehrlich sein, wenn er die Antworten, nach denen Sie suchen, nicht finden kann, und er wird Ihr Budget nicht durchforsten, um eine zu finden, die nicht da ist.

Suchen Sie nach Mr. Spock anstelle von Captain Kirk. Solide Recherche kann ein ausgezeichnetes Marketinginstrument sein, aber viel zu oft bezahlen die Leute für sexy Marketingmaterialien mit einem Hauch von Pseudorecherche und ohne dahinter stehende Logik. Manche Menschen sind von Natur aus analytischer, aber große analytische Fähigkeiten kommen aus der Praxis. Idealerweise hat jeder, den Sie mit der Analyse von Daten für Ihr Unternehmen beauftragen, Erfahrung darin, Lösungen für eine Vielzahl von Problemen zu finden. Jemand mit einem engen Fokus ist möglicherweise anfälliger für Gruppendenken, insbesondere wenn seine Erfahrungen Ihre eigenen stark widerspiegeln.

Put potential candidates on the spot with questions that help demonstrate their reasoning abilities. This is not the time to rely on behavioral questions alone. Ideal candidates will have the ability to strategically use known information to reasonably estimate the answer to complex problems. Ask logical reasoning questions, like “How many tennis balls could you fit in the Empire State Building?”

Finally, you should look for someone with whom you can communicate. All of the information in the world won't help if you can't put it to good use. If someone uses so much jargon in an introductory conversation that your eyes start to glaze over, then they probably aren't the right fit for your company.