Regresyon Analizi Kullanarak Gayrimenkul Değerlemesi - Bir Eğitim

Yayınlanan: 2022-03-11

Yönetici Özeti

Regresyon analizi, gayrimenkul değerlemesi için daha bilimsel bir yaklaşım sunar
  • Geleneksel olarak, mülk değerlemesi için üç yaklaşım vardır: karşılaştırılabilir satışlar, gelir ve maliyet.
  • Regresyon modelleri daha esnek ve objektif bir alternatif sunar. Aynı zamanda, bir model yapıldığında özerk hale gelen ve gayrimenkul girişimcilerinin temel yetkinliklerine odaklanmasına olanak tanıyan bir süreçtir.
  • Metrekare ve yatak odası sayısı gibi bir mülkün değeri üzerindeki etkisi test edilen çok sayıda değişkenle bir model oluşturulabilir.
  • Regresyonlar sihirli bir kurşun değildir. Değişkenlerin otokorelasyon ve/veya çoklu bağlantı içermesi veya değişkenler arasındaki korelasyonun sahte olması tehlikesi her zaman vardır.
Örnek: Allegheny County, Pennsylvania için bir regresyon değerleme modeli oluşturma
  • Modellere girmek için elektronik olarak erişilebilen çok sayıda gayrimenkul bilgisi vardır. Devlet kurumları, profesyonel veri sağlayıcılar ve Çoklu Listeleme Hizmetleri bu tür üç kaynaktır.
  • İlk veri dökümleri, düzensiz bilgi kümeleri olmadığından emin olmak için biraz temizlik gerektirir. Örneğin bizim örneğimizde hediye olarak devredilen evler adil piyasa değeri sonuçlarını bozmamak için kaldırılmıştır.
  • Verilerin %10'undan rastgele bir örnek kullanan SPSS, gayrimenkul değeri için en tahmin edici olarak aşağıdaki beş değişkeni döndürdü:
    • İnşaat kalitesine göre puan 1-19 (1=Çok Zayıf ve 19=Mükemmel)
    • Bitmiş Yaşam Alanı
    • Klima (Evet/Hayır)
    • Lot büyüklüğü
    • 1-8 arası fiziksel durum veya onarım durumu için not
  • Otokorelasyon için kullanılan Durbin-Watson testi ve değişen varyans için Breusch-Pagan testi ile sonuçların test edilmesi çok önemlidir. Modelimizde, bazı değişkenlerin değişkenliğinin tüm değerler aralığında eşit olmadığını gösteren hafif değişen varyans eğilimleri vardı.
Regresyona dayalı gayrimenkul analizi işiniz için faydalı olabilir mi?
  • Gayrimenkul değerlemesinin yanı sıra, gayrimenkul içindeki regresyon analizi diğer alanlarda özellikle faydalı olabilir:
    • Test, geçmiş anlaşmalardaki performansı döndürür
    • Liste fiyatları ve kiralama oranları için fiyatlandırma analizi
    • Konut alıcılarının ve kiracılarının demografik ve psikografik analizi
    • Doğrudan pazarlama için hedeflerin belirlenmesi
    • Pazarlama kampanyaları için yatırım getirisi analizi
  • Ayrıca, regresyon modelleri oluşturmak için adayları değerlendirirken, daha ilk günden dünyaya söz verenlere karşı dikkatli olun. Sağlam bir regresyon modeli oluşturmak yinelemeli bir süreçtir, bu nedenle doğal olarak meraklı ve yerinde düşünebilenlere odaklanın (yani beyin jimnastiğine bir düşünce süreci ile cevap verebilir).

Gayrimenkulde çok sık olarak, değerleme süreci, yüksek kaşlı bir parmak emme alıştırması olarak karşımıza çıkabilir. Emlakçı gelecek, meşhur lastikleri tekmeleyecek ve ardından çok az “niceliksel” içgörü ile tahmini bir değer üretecek. Birçokları için bir evin bir ömür boyu yapılan en büyük finansal yatırım olacağı düşünüldüğünde, mülk sahibi olmanın getirdiği duygusal bağlılık belki de süreci daha da kötüleştiriyor.

Ancak bu çılgınlığın da bir yöntemi var. Tam olarak üç tane.

Mülkiyet Nasıl Değerlenir?

Karşılaştırılabilir satış yaklaşımı, konut amaçlı gayrimenkullerde en yaygın olanıdır ve konu mülkün değerini belirlemek için benzer mülklerin son satışlarını kullanır. "Bileşenlerin" satış fiyatı, bunlar ile değerleme konusu mülk arasındaki farklara göre ayarlanır. Örneğin, karşılaştırılabilir bir mülkte ek bir banyo varsa, banyonun tahmini değeri, gözlemlenen satış fiyatından çıkarılır.

Ticari gayrimenkulün daha heterojen olduğu düşünülür, bu nedenle karşılaştırılabilir satış yaklaşımı daha az kullanılır. Bir varlığın gerçek değerinin, tüm iskonto edilmiş nakit akışlarının toplamına eşdeğer olduğu kavramına dayanan gelir yaklaşımı, daha yaygın olarak iki yöntem arasında uygulanır:

  1. Bir anüitenin bugünkü değerine benzer şekilde, doğrudan kapitalizasyon yöntemi, bir değer oluşturmak için bir mülkün net işletme gelirinin (NOI) "sınır oranı" ile bölünmesini kullanır. Üst sınır oranı, zımni bir iskonto oranı ve net işletme gelirinin gelecekteki büyüme oranını içerir.
  2. İndirgenmiş nakit akışı yöntemi, belirli bir süre boyunca gelecekteki nakit akışlarının bugünkü değerini, bir uç sınır oranı kullanılarak tahmin edilen bir uç değer ile sağlar.

Nihai teknik, değeri aynı bir arazi parçasını edinme ve değerleme konusu mülkün bir kopyasını inşa etme maliyetine dayalı olarak tahmin eden maliyet yaklaşımıdır. Daha sonra, konu gayrimenkulün mevcut eskime durumuna göre proje maliyeti amortismana tabi tutulur. Karşılaştırılabilir satış yaklaşımındaki düzenlemelere benzer şekilde, amaç konu mülkün yakın eşleşmesidir. Maliyet yaklaşımı diğer iki yaklaşıma göre daha az sıklıkla kullanılmaktadır.

Değerleme için kullanılan girdilerin seçimi nedeniyle, tüm geleneksel gayrimenkul değerleme yöntemleri özneldir. Örneğin, üst sınır oranı seçiminin bir mülk değerlemesi üzerinde önemli bir etkisi vardır: NOI'si 1 Milyon Dolar olan bir mülkü değerlendirirken üst sınır oranındaki %4'lük bir artış (%6'dan %10'a) mülkü %40 oranında artırdı (Aşağıdaki Grafik).

tavan oranı, gayrimenkul değerlemesi üzerinde orantısız bir etkiye sahiptir

Gayrimenkul Değerlemesinde Regresyon Modelleri Kullanmanın Faydaları

Gayrimenkul değerlemesi için regresyon modellerini kullanmanın sayısız faydası vardır. Perakende sektörü, site seçimi için kullanımını benimsedi, ancak emlak sektörü, çoğunlukla potansiyel avantajlarını gözden kaçırdı. Regresyon analizi, özellikle büyük miktarda veriyi analiz etmek için uygundur. Ülkedeki her yerel emlak piyasası hakkında güçlü bir bilgiye sahip olmak neredeyse imkansız olurdu, ancak regresyon modellemesi aramayı daraltmaya yardımcı olabilir.

1. Esneklik

Regresyon modellemeyi kullanmanın en büyük yararı, doğal esnekliğidir - diğer modellerden bağımsız olarak veya onlarla uyum içinde çalışabilirler.

En doğrudan yaklaşım, modelin bir çıktısı olarak konu mülkün değerini tahmin etmek için mevcut satış verilerini kullanmaktır. Yerel, eyalet ve federal kurumlardan özel veri sağlayıcılarıyla desteklenebilecek çok sayıda ücretsiz veri kaynağı vardır.

Diğer bir seçenek, diğer geleneksel değerleme yöntemleri için girdileri daha doğru bir şekilde tahmin etmek için regresyon modellerini kullanmaktır. Örneğin, karma kullanımlı bir ticari projeyi analiz ederken, bir geliştirici perakende alanı için metrekare başına satışları tahmin etmek için bir model ve konut bileşeni için kira oranlarını tahmin etmek için başka bir model oluşturabilir. Bunların her ikisi de daha sonra değerleme için bir gelir yaklaşımına girdi olarak kullanılabilir.

2. Objektif Yaklaşım

Sağlam istatistiksel ilkelerin kullanılması, değerlemeye daha objektif bir yaklaşım sağlar. İnsanlar önceden var olan fikirlerini doğrulayan bilgiler aradıklarında veya onunla çelişen yeni bilgileri reddettiklerinde ortaya çıkan doğrulama yanlılığından kaçınmanın en iyi yollarından biridir. Perakendeciler için yeni mağaza satışlarını tahmin etmeleri için modeller oluşturduğumda, çoğu perakendecinin bir rakibe yakın olmaktan fayda sağladığını öğrendiklerinde genellikle şaşırdılar. Aslında, genellikle en büyük rakipleri olan Walmart ile ortak yerleşim, modellerimde kullanılan en yaygın değişkenlerden biriydi. Mevcut önyargılara güvenmek, kaçırılan fırsatlara yol açabilir veya daha da kötüsü, felaketleri hemen köşede gizleyebilir.

İstatistiksel değerlemenin nesnel avantajlarından bazıları şunlardır:

  1. İstatistiksel analiz, modeldeki bireysel faktörlerin istatistiksel önemini (güvenilirliğini) belirlemenizi sağlar.
  2. Senaryo veya duyarlılık analizi size daha geleneksel yöntemlerdeki girdilerdeki değişiklikler hakkında genel bir fikir verebilirken, orijinal tahminin doğruluğu hakkında size daha iyi bir fikir vermekten ziyade birden fazla tahminde bulunmaya benzer. Öte yandan, bir regresyon modeli oluştururken, belirli bir güven düzeyine dayalı olarak sonuçların aralığının ne olacağını bileceksiniz.

Regresyon modelleri, yerleşik bir doğruluk denetimine sahip olmaları bakımından benzersizdir. Toplam popülasyonun bir örneğinde bir model oluşturduktan sonra, olası örnekleme yanlılığını saptamak için modeli örneklem dışı verilerde kullanabilirsiniz.

3. Temel Yetkinliğinize Bağlı Kalmak

Geleneksel değerleme yöntemlerinin hepsinde önemli bir seçim yanlılığı riski vardır. Karşılaştırılabilir mülkleri seçerken, en iyi sonuçları seçme ve bunların projenize en çok benzediğini varsayma tuzağına düşmek çok kolaydır. Gelir yaklaşımında getiri oranı gibi değişkenleri tahmin etmeye de vurgu yapılmaktadır. Bu tahmine olan ihtiyacı ortadan kaldırmak birçok gayrimenkul yatırımcısı için çekici olabilir, bu nedenle regresyona dayalı değerleme faydalı bir yaklaşımdır.

Regresyon Analizi ile İlgili Potansiyel Sorunlar

Oluşturulan istatistiklerin değişen yüzdelerinden alıntı yapılan şakaların miktarı aslında kendi içinde bir şakadır. Neredeyse her gün, çoğu geçen yıl yayınlanan bir araştırmayla çelişiyor gibi görünen yeni bir araştırma çalışmasının sonuçlarıyla ilgili medya manşetleriyle bombalanıyoruz. Saçma sapan bir dünyada, araştırmacılar tarafından kullanılan yöntemlerin titizliğini tartışmak için zaman yok.

Birçok regresyon analizi türü vardır, ancak en yaygın olanı doğrusal regresyondur. Modelin geçerli olduğunu düşünmek için ihlal edilmemesi gereken doğrusal regresyonlarla ilgili belirli varsayımlar vardır. Bu varsayımları ihlal etmek, girdilerin ve genel modelin tahmin gücünü hesaplayan istatistiksel testleri bozar.

Doğrusal Regresyon Varsayımları

Girdiler (bağımsız değişkenler) ile çıktı (bağımlı değişken) arasında doğrusal bir ilişki olmalıdır. Örneğin, bir evin ısıtılan metrekaresi ile toplam değeri arasında doğrusal bir ilişki olduğunu varsayabiliriz. Bununla birlikte, azalan getiriler nedeniyle, ilişkinin doğrusal olmadığını ve ham verilerin dönüştürülmesini gerektirdiğini keşfedebiliriz.

doğrusal ve doğrusal olmayan ilişki regresyon örneği

Bağımsız değişkenler rastgele olmamalıdır. Basitçe söylemek gerekirse, modeldeki her bağımsız değişken için gözlemler sabittir ve ölçümlerinde hata olmadığı varsayılır. Örneğin, bir apartmanın değerini modellemek için birim sayısını kullanıyorsak, örnek verilerimizdeki tüm binaların, modeli nasıl oluşturduğumuza bakılmaksızın değişmeyecek sabit sayıda birimi olacaktır.

Modelin "artıkları" (yani modelin tahmin edilen sonucu ile gerçek gözlemler arasındaki fark) 0'a veya daha basit bir ifadeyle toplanacaktır: kullanacağımız model en uygun çizgiyi temsil edecektir.

Model, her bağımsız değişken için tüm gözlemler için doğru olmalıdır. Bir evin değerini metrekare bazında tahmin edersek, 1.500 fit karenin altındaki evler için değerleri tahmin etmede son derece doğruysa modeli kullanmak istemezdik, ancak 3.000'in üzerindeki evler için büyük miktarda hata vardı. metrekare. Bu heteroskedastisite olarak bilinir.

değişen varyans ve homoskedastisite örneği

Gayrimenkul sektörüne bakıldığında doğrusal regresyonla ilgili en yaygın sorunlardan biri, gözlemler arasındaki artık hataların korelasyonudur. Bunu deseni olmayan beyaz gürültü olarak düşünebilirsiniz. Ancak, artıklar için bir kalıp varsa, o zaman büyük olasılıkla bir ayarlama yapmamız gerekir. Bu sorunu kavramsallaştırmak zordur, ancak gayrimenkul sektöründe bunun endişe kaynağı olduğu iki ana alan vardır.

1. Otokorelasyon

Uzun bir süre boyunca gözlemlere dayalı bir model oluşturmak, mevcut değerleri tahmin etmek için uygun olmayacaktır. Bağımsız bir değişken olarak ortalama oda ücretini kullanarak bir otel mülkünün değerini tahmin etmek için bir model oluşturduğumuzu varsayalım. Bu değişkenin tahmin gücü yanıltıcı olabilir çünkü oda fiyatları zaman içinde sürekli olarak artmıştır. İstatistiksel olarak, zaman içinde pozitif bir eğilim gösteren (yani enflasyon) gözlemlenen ortalama oda fiyatları arasında modelde hesaba katılmayacak bir otokorelasyon vardır. Konut gayrimenkullerinde en yaygın olarak kullanılan geleneksel karşılaştırılabilir satış yaklaşımı, yalnızca en güncel verileri kullanarak bu sorunu ortadan kaldırır. Çok daha az sayıda ticari işlem olduğundan, bu zaman kısıtlaması genellikle karşılaştırılabilir satış yaklaşımını etkisiz hale getirir. Bununla birlikte, otokorelasyon problemlerinin üstesinden gelebilecek lineer regresyon kullanan teknikler vardır.

Küme etkisi, gayrimenkul değerlemesinin modellenmesinde de önemli bir zorluktur. Bu, uzaysal otokorelasyon olarak düşünülebilir. Bu sorunu düşünmenin en basit yolu, bir otoyolun her iki tarafındaki iki mahallede (A ve B) evlerin değerini tahmin etmek için bir model inşa etmeyi hayal etmektir. Bir bütün olarak, model değerleri tahmin etmede iyi çalışabilir, ancak artık hataları incelediğimizde bir model olduğunu fark ederiz. A mahallesindeki evler genellikle yaklaşık %10 aşırı değerlidir ve B mahallesindeki evler kabaca %10 değersizdir. Modelimizi geliştirmek için bu küme etkisini hesaba katmamız veya her mahalle için bir model oluşturmamız gerekiyor.

2. Çoklu doğrusallık

İdeal olarak, bir model içindeki değişkenler birbirleriyle ilişkilendirilmeyecektir. Bilinen bu soruna çoklu bağlantı denir. Bölgesel alışveriş merkezlerine değer veren bir modele girdi olarak hem fit kareyi hem de park yeri sayısını kullanmak, muhtemelen çoklu doğrusallık gösterecektir. Bu sezgiseldir çünkü planlama kodları genellikle bir ticari alanın metrekaresine dayalı olarak belirli sayıda park yeri gerektirir. Bu örnekte, değişkenlerden birinin çıkarılması, tahmin gücünü önemli ölçüde düşürmeden ayarlanmış modelin daha doğru bir değerlendirmesini verecektir.

Diğer Hususlar

Gözlemlenen verileri kullanmak, herhangi bir ampirik yaklaşımın özüdür, ancak geçmiş sonuçların her zaman geleceği tahmin etmediğini hatırlamak önemlidir. Gayrimenkul gibi likit olmayan varlıklar, iş döngüsündeki değişikliklere karşı özellikle savunmasızdır. Belirli değişkenler için tahmin gücünün mevcut ekonomik koşullara göre değişmesi muhtemeldir. Bu problem lineer regresyona özgü değildir ve geleneksel yaklaşımlarda da bulunur.

Korelasyon nedenselliğe eşit değildir. Model oluşturmanın amacı, geçerli tahminler yapacak faydalı değişkenler bulmaktır. Sahte korelasyonlara karşı dikkatli olmalısınız. Maine'deki boşanma oranı ile kişi başına düşen margarin tüketimi arasında son derece güçlü bir ilişki olduğunu öğrenmek sizi şaşırtabilir. Bununla birlikte, gelecekteki margarin satışlarını tahmin etmeye çalışıyorsanız, Maine'den gelen boşanma verilerini kullanmak mantıklı olmaz.

Regresyon Yoluyla Gayrimenkul Değerlemesinin Gerçek Hayattan Bir Örneği

Şimdi bu bilgiyi pratikte uygulayalım ve baştan sona doğrusal bir model oluşturalım. Örneğimiz için, Pennsylvania, Alleghany County'deki müstakil müstakil evlerin değerini tahmin eden bir gayrimenkul değerleme modeli oluşturmaya çalışacağız. Alleghany İlçesinin seçimi keyfidir ve gösterilen prensipler her yerde işe yarayacaktır. Yaygın olarak kullanılan bir istatistik yazılımı olan Excel ve SPSS kullanacağız.

Veri bulma

Kaliteli veri bulmak, doğru bir model oluşturmanın ilk adımıdır ve belki de en önemlisidir. Hepimiz “çöp içeri, çöp dışarı” ifadesini duymuş olsak da, mükemmel bir veri kümesi olmadığını hatırlamak önemlidir. Örnek verilerin tüm popülasyonu temsil ettiğini rahatça varsaydığımız sürece bu iyidir. Gayrimenkul verilerinin üç ana kaynağı vardır:

  1. İlk ve genellikle en iyi veri kaynağı devlet kurumlarından gelir. Bu verilerin çoğu ya ücretsiz ya da nispeten düşük maliyetlidir. Birçok şirket, kolayca ücretsiz olarak alabileceğiniz veriler için sizden ücret alacaktır, bu nedenle, veri satın almadan önce her zaman internete hızlıca göz atın. Bir web araması, genellikle aradığınız ilçe veya şehir ve "vergi değerlendiricisi", "vergi değerlendirmesi", "emlak kayıtları" veya "tapu araması" gibi kelimeleri arayarak sonuçlar verir. Coğrafi Bilgi Sistemleri (CBS) departmanları, birçok topluluğun en çok gözden kaçan bölümlerinden biridir. Genellikle diğer çeşitli yerel kurumlardan toplanan verilerin çoğuna sahiptirler. Bir gayrimenkul geliştiricisi olarak, geliştirme için yeni mülklerin bulunmasına yardımcı olacak modeller oluşturmak için kullandığım yüksek kaliteli verileri bulmak için genellikle onların yardımlarına güvendim. Ekonomik kalkınma kuruluşları da mükemmel bir veri kaynağı olabilir.
  2. Kâr amaçlı satıcılar başka bir seçenektir. Birden çok alanda veri ararken özellikle yararlıdırlar. Verileri için büyük miktarda para ödemeden önce ödevinizi yaptığınızdan emin olun. Tamlık açısından yanıltıcı olabileceğinden, yalnızca örnek veri kümelerine güvenmeyin. Ellerinde hangi verilere sahip oldukları konusunda şüpheniz varsa, doğrudan bir temsilciyle görüşün veya para iade garantisi hakkında bilgi alın.
  3. Son olarak, yerel Çoklu Listeleme Servisleri (MLS) paha biçilmez bir kaynaktır. Çoğu mülk, bir MLS üyesi olan bir emlakçı aracılığıyla pazarlanır. Genel olarak, bir MLS üyelerinin tüm listelerini yerel sisteme koymaları gerekir. Ne yazık ki, bir MLS'ye katılma konusunda genellikle birçok kısıtlama vardır ve veri erişiminin maliyeti oldukça yüksek olabilir. Verilerini kullanırken hizmet şartlarını ihlal etmediğinizden emin olmanız ve kendinizi olası sorumluluğa açmanız da önemlidir.

Örneğimiz için yalnızca Western Pennsylvania Regional Data Center ve US Census Bureau'dan alınan ücretsiz verileri kullanacağız. Alleghany Gayrimenkul Satış verileri, satış fiyatının bağımlı değişkenimiz (Y değişkeni) olduğu gözlemlerimiz için bize bir temel dosya verecektir. Ayrıca, her bir nüfus sayımı sistemi için yürüme puanını ve vergi değerlendirme bilgilerini kullanarak değişkenleri test edeceğiz.

Gayrimenkul modelleri oluştururken sahip olunması gereken çok faydalı bir değişken, her adresin enlem ve boylamıdır. Bu verileri, bir enlem ve boylam atamak için bir sokak adresi kullanan bir coğrafi kodlayıcı aracılığıyla elde edebilirsiniz. ABD Sayım Bürosu coğrafi kodlayıcısı, demografik ve psikografik bilgileri toplamak için yaygın olarak kullanılan her konum için nüfus sayımı yolunu da belirleyecektir.

Yeni değişkenleri analiz etme, dönüştürme ve oluşturma.

Artık veri kaynaklarımızı seçtiğimize göre, verinin kalitesini incelememiz gerekiyor. Veri kalitesini kontrol etmenin en kolay yolu, birkaç temel değişken için bir sıklık tablosu çalıştırmaktır. Önemli sayıda eksik veya bozuk giriş varsa, verileri daha fazla incelememiz gerekecek. Aşağıdaki tablo, satış dosyasında 216.498 kayıttan yalnızca 1'inin posta kodunun eksik olduğunu ve 99999 veya 1X#45 gibi hatalı posta kodu olmadığını göstermektedir. Bu muhtemelen bunun yüksek kaliteli bir veri seti olduğunu gösterir.

hata tablosu

Bir veri sözlüğü, mevcut olduğunda mükemmel bir kaynaktır. Her bir değişkenin neyi ölçtüğünün bir tanımını ve değişken için olası seçenekleri verecektir. Verilerimiz, ilçede yapılan her satışın bir analizini içerir. Bu, özellikle ham tapu kayıtları ile çalışırken önemli bir bilgidir. Tüm gayrimenkul işlemlerinin yasalarca uygulanabilir olması için kaydedilmesi gerekir, ancak tüm transferler bir mülkün gerçek adil piyasa değerini yansıtmaz. Örneğin, iki aile üyesi arasındaki bir satış, hediye olarak veya tapu pulu gibi daha yüksek işlem maliyetlerini ödememek için piyasa fiyatının altında olabilir. Şansımıza yerel yönetim, mevcut piyasa değerlerini temsil etmediğini düşündükleri transferleri açıkça işaretliyor, bu nedenle yalnızca “geçerli bir satışı” yansıtan kayıtları kullanacağız. Bu satışlar, toplam işlem sayısının yalnızca %18'ini oluşturur ve verilerinizi analiz için kullanmaya başlamadan önce anlamanın ne kadar önemli olduğunu gösterir. Tecrübelerime göre bu oran tapu kayıtlarını incelerken oldukça yaygındır. “Geçersiz satışları” içeren bir model oluşturursak, nihai sonuçlarımızın çarpıtılması kuvvetle muhtemeldir.

Daha sonra, değerlendirme verilerimizi ve yürüyüş puanlarımızı satış dosyasına ekleyeceğiz. Bu bize modelimiz için kullanılacak tek bir tablo verir. Bu noktada değişkenlerin lineer regresyona uygun olup olmadıklarını analiz etmemiz gerekiyor. Aşağıda çeşitli değişken türlerini gösteren bir tablo bulunmaktadır.

regresyon için değişken testi

Dosyamız, verileri herhangi bir düzen duygusu olmadan kategorize eden mahalle veya posta kodu gibi birkaç nominal değer içerir. Nominal değerler, dönüşüm olmadan doğrusal regresyon için uygun değildir. Ayrıca inşaatın kalitesini, mülkün mevcut durumunu vb. derecelendiren birkaç sıra değişkeni vardır. Sıralı verilerin kullanımı yalnızca, her bir sıranın eşit aralıklı olduğunu makul bir şekilde varsaydığımızda uygundur. Örneğin, verilerimiz 19 farklı sınıflandırmaya (A+, A, A-, vb.) sahip bir not değişkenine sahiptir, bu nedenle bu notların muhtemelen eşit aralıklarla yerleştirildiğini güvenle varsayabiliriz.

Ayrıca onları modelde kullanabilmemiz için dönüştürülmesi gereken birkaç değişken var. Test için kukla değişkene dönüştürülebilen bir nominal değer, ısıtma ve soğutma değişkenidir. Klimasız tüm mülkler için değişkeni 0, kliması olanlar 1 olarak ayarlayacağız. Ayrıca, harf notlarının sayıya dönüştürülmesi gerekir (örn. 0=En Kötü, 1=Daha İyi, 2=En iyi) fiyat ile doğrusal bir ilişki varsa.

Son olarak, tüm gözlemleri kullanmanın uygun olup olmadığını belirlememiz gerekiyor. Tek ailelik müstakil evlerin değerlerini tahmin etmek istiyoruz, böylece tüm ticari mülkleri, apartman dairelerini ve şehir evlerini verilerden çıkarabiliriz. Ayrıca, otokorelasyonla ilgili olası sorunlardan kaçınmak istiyoruz, bu nedenle, bunun meydana gelme olasılığını sınırlamak için yalnızca 2017'deki satışlar için verileri kullanıyoruz. Tüm yabancı kayıtları eledikten sonra, test edilecek son veri setimiz var.

Örnek ve değişken seçimi

Doğru örnek boyutunu seçmek zor olabilir. Akademik materyaller arasında önerilen çok çeşitli minimum sayılar ve çeşitli temel kurallar vardır. Çalışmamız için genel popülasyon oldukça büyüktür, bu nedenle yeterli örneklem elde etme konusunda endişelenmemize gerek yoktur. Bunun yerine, neredeyse her değişkenin modelde istatistiksel bir önemi olacak kadar büyük bir örneğe sahip olma riskiyle karşı karşıyayız. Sonunda, kayıtların yaklaşık %10'u modelleme için rastgele seçilmiştir.

Değişken seçimi, istatistiksel yazılım olmadan sürecin en zor kısımlarından biri olabilir. Bununla birlikte, SPSS, doğrusal bir regresyon için uygun olduğunu düşündüğümüz değişkenlerin bir kombinasyonundan birçok modeli hızlı bir şekilde oluşturmamızı sağlar. SPSS, istatistiksel anlamlılık için eşiklerimize dayalı olarak değişkenleri otomatik olarak filtreleyecek ve yalnızca en iyi modelleri döndürecektir.

Modelin oluşturulması ve sonuçların gözden geçirilmesi

Örnek verilerimizden SPSS beş model üretti. En tahmin edici olan model aşağıdaki 5 değişkeni içeriyordu.

  1. İnşaat kalitesine göre puan 1-19 (1=Çok Zayıf ve 19=Mükemmel)
  2. Bitmiş Yaşam Alanı
  3. Klima (Evet/Hayır)
  4. Lot büyüklüğü
  5. Fiziksel durum veya onarım durumu için derece 1-8 (1=Yaşanamaz ve 8=mükemmel)

SPSS sonuçlarına bir göz atalım. Ana odak noktamız başlangıçta, bize bağımlı değişkendeki (fiyat) varyansın yüzde kaçının regresyon tarafından tahmin edildiğini söyleyen R-kare değeri üzerinde olacaktır. Mümkün olan en iyi değer 1 olacaktır ve modelimizin sonucu oldukça umut vericidir. Modelin kesinliğini ölçen tahminin standart hatası 73.091 dolarda oldukça yüksek görünüyor. Ancak, bunu modeldeki satış fiyatının standart sapması (160.429 $) ile karşılaştırırsak, hata makul görünüyor.

Regresyon çıkışı 1

Model 5, kabul edilebilir bir standart hataya sahipti ve Durbin-Watson Testini geçti

SPSS, Durbin-Watson Testini kullanarak otokorelasyonu test etmek için yerleşik işlevselliğe sahiptir. İdeal olarak, 0 ila 4 arasında bir ölçekte değer 2.0 olacaktır, ancak 1.652 değeri alarma neden olmamalıdır.

Daha sonra, değişen varyans kanıtı olup olmadığını belirlemek için modelin sonuçlarını test ederiz. SPSS için yerleşik bir işlevsellik yoktur, ancak Ahmad Daryanto tarafından yazılan bu makroyu kullanarak Breusch-Pagan ve Koenker testlerini kullanabiliriz. Bu testler, aşağıdaki grafikteki anlamlılık düzeyi (Sig) .005'in altında olduğu için modelimizde değişen varyanslılığın mevcut olduğunu göstermektedir. Modelimiz, lineer regresyonun klasik varsayımlarından birini ihlal etti. Büyük olasılıkla, problemi ortadan kaldırmak için modeldeki değişkenlerden birinin dönüştürülmesi gerekiyor. Ancak, bunu yapmadan önce, değişen varyansın etkilerinin bağımsız değişkenlerimizin tahmin gücü üzerinde ne olduğunu görmek iyi bir fikirdir. Andrew F. Hayes tarafından geliştirilen bir makro kullanarak, bağımsız değişkenlerimiz için düzeltilmiş standart hatalara ve anlamlılık seviyelerine bakabiliriz.

Regresyon çıktısı 2

Modelde değişen varyans var, ancak ileri testler bunun bağımsız değişkenleri etkilemediğini gösteriyor.

Daha ileri testler, modeldeki değişen varyansı hesaba kattıktan sonra bağımsız değişkenlerin istatistiksel olarak anlamlı kaldığını ortaya koyuyor, bu yüzden şimdilik onu değiştirmemiz gerekmiyor.

Modeli test edin ve iyileştirin

Son bir test olarak, orijinal numunenin parçası olmayan tüm satış kayıtlarını modelimiz ile puanlayacağız. Bu, modelin daha büyük bir veri kümesinde nasıl performans gösterdiğini görmemize yardımcı olacaktır. Bu testin sonuçları, tahminin R-kare değerinin ve standart hatasının büyük veri setinde önemli ölçüde değişmediğini gösteriyor ve bu da muhtemelen modelimizin beklendiği gibi performans göstereceğini gösteriyor.

Regresyon çıkışı 3

Modelin tam veri kümesine uygulanması, gözlemlenen benzer R-kare ve standart hata değerleriyle örneklemle tutarlılık gösterir.

Örnek modelimizi gerçek hayatta kullanmak isteseydik, verileri daha kesin olan birkaç modele sahip olacak şekilde bölümlere ayırır veya bu tek modelin kesinliğini artırmak için ek veriler arardık. Bu adımlar, modelde gördüğümüz değişen varyanslılığı da ortadan kaldıracaktır. 1 milyondan fazla nüfusa sahip bir ilçede evlerin değerini tahmin etmek için tek bir model kullanmaya çalıştığımız gerçeğine dayanarak, “mükemmel” modeli sadece birkaç saat içinde inşa edemememiz şaşırtıcı olmamalı. .

Sonuçlar

Amacımız, müstakil müstakil evlerin değerini tahmin eden bir model oluşturmaktı. Analizimiz, bu amaca makul bir hassasiyetle ulaştığımızı gösteriyor, ancak modelimiz mantıklı mı?

Modelimizi tarif edecek olsaydık, bir evin değerinin arsanın büyüklüğüne, evin metrekaresine, inşaat kalitesine, mevcut onarım durumuna ve mevcut olup olmadığına bağlı olduğunu söylerdik. klima. Bu çok makul görünüyor. Aslında, modelimizi geleneksel değerleme yöntemleriyle karşılaştırırsak, arazi edinme ve mevcut eskime durumuna göre ayarlanmış yeni bir bina inşa etme maliyetini ekleyen maliyet yaklaşımına çok benzediğini görüyoruz. Ancak bu benzerlik, bir regresyon deyimi kullanmak gerekirse, sahte bir korelasyon olabilir.

Eski mülklerin amortismanı için uygun yöntemin belirlenmesindeki sorunlar nedeniyle, tipik olarak maliyet yaklaşımı yalnızca yeni mülklerin değerlemesi için önerilir. Modelimizle, her yaştaki mülk için faydalı olan benzer bir strateji oluşturduk, aslında yaşı bağımsız bir değişken olarak test ettik ve özelliklerin değeri üzerinde istatistiksel olarak anlamlı bir etkisi olmadığı sonucuna vardık!

İşletmeniz İçin Regresyon Analizini Kullanma

Umarım şimdiye kadar regresyon analizinin temellerini daha iyi anlamışsınızdır. Bir sonraki soru şudur: işinize yardımcı olabilir mi? Bu sorulardan herhangi birine evet yanıtı veriyorsanız, muhtemelen bir araç olarak regresyon analizini kullanmaktan faydalanabilirsiniz.

  1. Değeri belirlemek, projeksiyon yapmak veya belirli bir pazarı analiz etmek için daha bilimsel bir yaklaşım mı istiyorsunuz?
  2. Geniş alanlar, bölgeler ve hatta ülke çapında potansiyel gayrimenkul yatırımlarını belirlemenin daha iyi yollarını mı arıyorsunuz?
  3. Hedefiniz, ticari gayrimenkul projeniz için büyük perakendecileri, restoranları veya konaklama şirketlerini çekmek mi?
  4. Sürece yeni veri noktaları ekleyerek karar verme sürecinizi potansiyel olarak iyileştirebileceğinizi düşünüyor musunuz?
  5. Alıcılar ve yatırımcılar için pazarlamaya yaptığınız yatırımın geri dönüşü konusunda endişeli misiniz?

Yukarıdaki örnek model, gayrimenkulde regresyon modellemesi kullanmanın değerinin basit bir gösterimidir. Verileri toplamak ve modeli oluşturmak için geçen 2-3 saat, tam potansiyelini göstermekten çok uzak. Uygulamada, gayrimenkul endüstrisinde gayrimenkul değerlemesinin ötesinde, aşağıdakiler de dahil olmak üzere çok çeşitli regresyon analizi kullanımları vardır:

  1. Liste fiyatları ve kiralama oranları için fiyatlandırma analizi
  2. Konut alıcılarının ve kiracılarının demografik ve Psikografik analizi.
  3. Doğrudan pazarlama için hedeflerin belirlenmesi
  4. Pazarlama kampanyaları için yatırım getirisi analizi

Jeo-uzamsal modelleme, gayrimenkuldeki en önemli üç şeyle eşleştirilmiş regresyon analizi ilkelerini kullanır: konum, konum, konum. Sekiz yıldır konut geliştiricisi olarak çalışmak, jeo-uzamsal modellemenin gücünü kanıtlayabilirim. ArcGIS'i kullanarak, Kuzey Carolina dağlarında geliştirme için ideal olan mülkleri bulmak için satış verilerini, parsel haritalarını ve lidar verilerini birleştirmeyi başardım.

Tecrübelerime dayanarak, gayrimenkuldeki paranın çoğu bir projenin geliştirilmesinde değil satın alınmasında kazanılıyor. Başkalarının kaçırdığı fırsatları belirleyebilmek, gayrimenkulde muazzam bir rekabet avantajı olabilir. Jeo-uzamsal analitik, büyük şirketlerin uzun yıllardır yararlandığı bir şeydir, ancak daha küçük şirketler genellikle gözden kaçırır.

İşletmeniz İçin Doğru Analiz Ortağını Nasıl Belirlersiniz?

Çok az insan istatistikleri en sevdikleri konu olarak değerlendirir. Aslında, bir bütün olarak insanlar, temel olasılıkları bile anlamakta çok kötüler. Bu görüşten şüphe duyuyorsanız, Las Vegas veya Makao'ya bir gezi yapın. Ne yazık ki, bu, sürecinizde regresyon analizi uygulamak için tavsiye ararken kime güveneceğinizi belirlemeyi zorlaştırabilir. Potansiyel adayları değerlendirirken aramanız gereken bazı önemli noktalar şunlardır:

İnsanlar olasılıkları yargılamada kötü olsa da, sezgi aslında yalanları tespit etmede oldukça iyidir. Tüm sorularınıza cevap verecek bir model inşa edebileceğini iddia eden herkese karşı çok şüpheci olmalısınız! Sonuç garantisine güvenmeyin. Umarım bu makale, regresyon analizinin ampirik gözleme ve sağlam bilime dayandığı gerçeğini göstermiştir. Bazı şeyleri tahmin etmenin diğerlerinden daha kolay olduğu her zaman böyle olacaktır. Güvenilir bir danışman, aradığınız yanıtları bulamadığında açık ve dürüst olacaktır ve orada olmayanı bulmak için bütçenizi zorlamaz.

Kaptan Kirk yerine Bay Spock'u arayın. Sağlam araştırma mükemmel bir pazarlama aracı olabilir, ancak çoğu zaman insanlar seksi pazarlama materyalleri için sahte bir araştırma kokusuyla ve bunu destekleyecek hiçbir mantık olmadan para ödüyorlar. Bazı insanlar doğal olarak daha analitiktir, ancak büyük analitik beceriler pratikten gelir. İdeal olarak, işinizle ilgili verileri analiz etmesi için tuttuğunuz herkes, çok çeşitli sorunlara çözüm bulma deneyimine sahip olacaktır. Dar odaklı biri, özellikle deneyimleri sizinkileri yakından yansıttığında, grup düşüncesine daha yatkın olabilir.

Put potential candidates on the spot with questions that help demonstrate their reasoning abilities. This is not the time to rely on behavioral questions alone. Ideal candidates will have the ability to strategically use known information to reasonably estimate the answer to complex problems. Ask logical reasoning questions, like “How many tennis balls could you fit in the Empire State Building?”

Finally, you should look for someone with whom you can communicate. All of the information in the world won't help if you can't put it to good use. If someone uses so much jargon in an introductory conversation that your eyes start to glaze over, then they probably aren't the right fit for your company.