Penilaian Real Estat Menggunakan Analisis Regresi – Sebuah Tutorial
Diterbitkan: 2022-03-11Ringkasan bisnis plan
Analisis regresi menawarkan pendekatan yang lebih ilmiah untuk penilaian real estat
- Secara tradisional, ada tiga pendekatan untuk menilai properti: penjualan, pendapatan, dan biaya yang sebanding.
- Model regresi memberikan alternatif yang lebih fleksibel dan objektif. Ini juga merupakan proses yang begitu model dibuat, menjadi otonom, memungkinkan pengusaha real estat untuk fokus pada kompetensi inti mereka.
- Sebuah model dapat dibangun dengan berbagai variabel yang diuji dampaknya terhadap nilai properti, seperti luas persegi dan jumlah kamar tidur.
- Regresi bukanlah peluru ajaib. Selalu ada bahaya bahwa variabel mengandung autokorelasi dan/atau multikolinearitas, atau korelasi antar variabel itu palsu.
Contoh: membangun model penilaian regresi untuk Allegheny County, Pennsylvania
- Ada sejumlah besar informasi real estat yang dapat diakses secara elektronik untuk dimasukkan ke dalam model. Instansi pemerintah, penyedia data profesional, dan Multiple Listing Services adalah tiga sumber tersebut.
- Pembuangan data awal memerlukan pembersihan untuk memastikan bahwa tidak ada kumpulan informasi yang tidak teratur. Misalnya, dalam sampel kami, rumah yang dialihkan sebagai hadiah dihapus, agar tidak mendistorsi hasil nilai pasar wajar.
- Menggunakan sampel acak dari 10% data, SPSS mengembalikan lima variabel berikut sebagai yang paling prediktif untuk nilai real estat:
- Grade berdasarkan kualitas konstruksi peringkat 1-19 (1=Sangat Buruk dan 19=Sangat Baik)
- Ruang Tamu Selesai
- AC (Ya/Tidak)
- Banyak ukuran
- Grade untuk kondisi fisik atau kondisi perbaikan peringkat 1-8
- Pengujian hasil sangat penting, dengan uji Durbin-Watson digunakan untuk autokorelasi dan uji Breusch-Pagan untuk heteroskedastisitas. Dalam model kami, ada sedikit kecenderungan heteroskedastis, yang menunjukkan bahwa variabilitas beberapa variabel tidak sama di seluruh rentang nilai.
Dapatkah analisis real estat berbasis regresi berguna untuk bisnis Anda?
- Selain menilai properti, analisis regresi dalam real estat dapat sangat bermanfaat di bidang lain:
- Pengujian mengembalikan kinerja pada transaksi sebelumnya
- Analisis harga untuk daftar harga dan tarif sewa
- Analisis demografis dan psikografis pembeli dan penyewa perumahan
- Mengidentifikasi target untuk pemasaran langsung
- Analisis ROI untuk kampanye pemasaran
- Selain itu, saat menilai kandidat untuk membangun model regresi, waspadalah terhadap mereka yang menjanjikan dunia sejak hari pertama. Membangun model regresi yang kuat adalah proses berulang, jadi alih-alih fokus pada mereka yang secara alami ingin tahu dan dapat berpikir di tempat (yaitu dapat menjawab permainan asah otak dengan proses berpikir).
Terlalu sering di real estat, proses penilaian dapat dianggap sebagai latihan mengisap jempol. Makelar akan datang, menendang ban pepatah, dan kemudian menghasilkan nilai perkiraan dengan wawasan "kuantitatif" yang sangat sedikit. Mungkin prosesnya diperburuk oleh keterikatan emosional yang dibawa oleh kepemilikan properti mengingat bagi banyak orang, sebuah rumah akan menjadi investasi finansial terbesar yang dibuat seumur hidup.
Namun, ada metode untuk kegilaan ini. Yah, tiga tepatnya.
Bagaimana Properti Dinilai?
Pendekatan penjualan yang sebanding adalah yang paling umum di real estat perumahan dan menggunakan penjualan terbaru dari properti serupa untuk menentukan nilai properti subjek. Harga jual "perusahaan" disesuaikan berdasarkan perbedaan antara mereka dan properti subjek. Misalnya, jika properti yang sebanding memiliki kamar mandi tambahan, maka taksiran nilai kamar mandi tersebut dikurangkan dari harga jual yang diamati.
Real estat komersial dianggap lebih heterogen, sehingga pendekatan penjualan yang sebanding lebih jarang digunakan. Pendekatan pendapatan, berdasarkan konsep bahwa nilai intrinsik suatu aset setara dengan jumlah semua arus kas yang didiskontokan, lebih umum diterapkan di dua metode:
- Mirip dengan nilai sekarang dari anuitas, metode kapitalisasi langsung menggunakan pendapatan operasional bersih (NOI) dari properti dibagi dengan "tingkat batas" untuk menetapkan nilai. Tingkat topi berisi tingkat diskonto tersirat dan tingkat pertumbuhan masa depan pendapatan operasional bersih.
- Metode arus kas yang didiskontokan memberikan nilai sekarang dari arus kas masa depan selama periode waktu tertentu, dengan nilai terminal yang diestimasi dengan menggunakan tarif batas terminal.
Teknik terakhir adalah pendekatan biaya, yang memperkirakan nilai berdasarkan biaya perolehan sebidang tanah yang identik dan membangun replika properti subjek. Kemudian biaya proyek disusutkan berdasarkan keadaan usang dari properti subjek saat ini. Serupa dengan penyesuaian dalam pendekatan penjualan yang sebanding, tujuannya adalah untuk mencocokkan secara dekat properti subjek. Pendekatan biaya lebih jarang digunakan daripada dua pendekatan lainnya.
Semua metode penilaian real estat tradisional bersifat subjektif, karena pemilihan input yang digunakan untuk penilaian. Misalnya, pilihan tarif batas memiliki dampak signifikan pada penilaian properti: ketika menilai properti dengan NOI $1 juta, peningkatan 4% dalam tarif batas (dari 6% menjadi 10%) akan menurunkan nilai properti sebesar 40% (Grafik Di Bawah).
Manfaat Menggunakan Model Regresi dalam Penilaian Real Estat
Ada banyak manfaat menggunakan model regresi untuk penilaian real estat. Industri ritel telah menerapkan penggunaannya untuk pemilihan lokasi, tetapi industri real estat, sebagian besar, telah mengabaikan potensi keuntungannya. Analisis regresi sangat cocok untuk menganalisis sejumlah besar data. Praktis tidak mungkin memiliki pengetahuan yang kuat tentang setiap pasar real estat lokal di negara ini, tetapi pemodelan regresi dapat membantu mempersempit pencarian.
1. Fleksibilitas
Manfaat terbesar menggunakan pemodelan regresi adalah fleksibilitas yang melekat - mereka dapat bekerja secara independen dari model lain atau bersama-sama dengan mereka.
Pendekatan yang paling langsung adalah dengan menggunakan data penjualan yang ada untuk memprediksi nilai properti subjek, sebagai output ke model. Ada banyak sumber data gratis dari lembaga lokal, negara bagian, dan federal yang dapat dilengkapi dengan penyedia data pribadi.
Pilihan lainnya adalah menggunakan model regresi untuk memprediksi input secara lebih akurat untuk metode penilaian tradisional lainnya. Misalnya, ketika menganalisis proyek komersial penggunaan campuran, pengembang dapat membangun satu model untuk memprediksi penjualan per kaki persegi untuk ruang ritel, dan model lain untuk memprediksi tarif sewa untuk komponen perumahan. Kedua hal ini kemudian dapat digunakan sebagai masukan untuk pendekatan pendapatan untuk penilaian.
2. Pendekatan Objektif
Menggunakan prinsip-prinsip statistik yang baik menghasilkan pendekatan penilaian yang lebih objektif. Ini adalah salah satu cara terbaik untuk menghindari bias konfirmasi, yang terjadi ketika orang mencari informasi yang menegaskan pendapat mereka yang sudah ada sebelumnya atau menolak informasi baru yang bertentangan dengannya. Ketika saya telah membangun model untuk pengecer untuk memprediksi penjualan toko baru, mereka sering terkejut mengetahui bahwa banyak pengecer mendapat manfaat dari berada di dekat pesaing. Faktanya, colocation dengan Walmart, yang sering menjadi pesaing terbesar mereka, adalah salah satu variabel yang paling umum digunakan dalam model saya. Mengandalkan bias yang ada dapat menyebabkan hilangnya peluang, atau lebih buruk lagi, menyembunyikan bencana di tikungan.
Beberapa keuntungan objektif dari penilaian statistik adalah sebagai berikut:
- Analisis statistik memungkinkan Anda untuk menentukan signifikansi statistik (keandalan) dari masing-masing faktor dalam model.
- Meskipun analisis skenario atau sensitivitas dapat memberi Anda gambaran umum tentang perubahan input dalam metode yang lebih tradisional, ini lebih mirip dengan membuat beberapa prediksi daripada memberi Anda gambaran yang lebih baik tentang keakuratan prediksi asli. Di sisi lain, ketika membangun model regresi, Anda akan mengetahui kisaran hasil yang akan didasarkan pada tingkat kepercayaan tertentu.
Model regresi unik karena memiliki pemeriksaan akurasi bawaan. Setelah membuat model pada sampel dari total populasi, Anda dapat menggunakan model pada data di luar sampel untuk mendeteksi kemungkinan bias pengambilan sampel.
3. Berpegang teguh pada Kompetensi Inti Anda
Semua metode penilaian tradisional memiliki risiko bias seleksi yang signifikan. Saat memilih properti yang sebanding, sangat mudah untuk jatuh ke dalam perangkap memilih hasil terbaik dan menganggapnya paling mirip dengan proyek Anda. Ada juga penekanan pada variabel prediksi, seperti tingkat pengembalian dalam pendekatan pendapatan. Menghilangkan kebutuhan akan prediksi ini bisa menarik bagi banyak investor real estat, itulah sebabnya penilaian berbasis regresi adalah pendekatan yang berguna.
Potensi Masalah dengan Analisis Regresi
Jumlah lelucon yang mengutip berbagai persentase statistik yang dibuat memang merupakan lelucon dalam dirinya sendiri. Hampir setiap hari kita dibombardir dengan berita utama media tentang hasil studi penelitian baru, banyak di antaranya tampaknya bertentangan dengan penelitian yang diterbitkan tahun lalu. Dalam dunia soundbites, tidak ada waktu untuk membahas ketatnya metode yang digunakan oleh para peneliti.
Ada banyak jenis analisis regresi, tetapi yang paling umum adalah regresi linier. Ada asumsi tertentu tentang regresi linier yang tidak boleh dilanggar untuk mempertimbangkan model yang valid. Melanggar asumsi ini mendistorsi uji statistik yang menghitung daya prediksi input dan model keseluruhan.
Asumsi Regresi Linier
Harus ada hubungan linier antara input (variabel independen) dan output (variabel dependen). Misalnya, kita dapat berasumsi bahwa ada hubungan linier antara kaki persegi yang dipanaskan di sebuah rumah dan nilai keseluruhannya. Namun, karena hasil yang semakin berkurang, kita dapat menemukan bahwa hubungan tersebut non-linier, membutuhkan transformasi data mentah.
Variabel bebas tidak boleh acak. Sederhananya, pengamatan untuk setiap variabel independen dalam model adalah tetap dan diasumsikan tidak memiliki kesalahan dalam pengukurannya. Misalnya, jika kita menggunakan jumlah unit untuk memodelkan nilai sebuah gedung apartemen, semua gedung dalam data sampel kita akan memiliki jumlah unit tetap yang tidak akan berubah, terlepas dari bagaimana kita membangun modelnya.
"Residual" model (yaitu perbedaan antara hasil prediksi model dan pengamatan aktual) akan berjumlah 0, atau dalam istilah yang lebih sederhana: model yang akan kita gunakan akan mewakili garis yang paling sesuai.
Model harus akurat untuk semua pengamatan untuk setiap variabel bebas. Jika kami memprediksi nilai rumah berdasarkan luas perseginya, kami tidak ingin menggunakan model jika model tersebut sangat akurat dalam memprediksi nilai rumah di bawah 1.500 kaki persegi, tetapi ada banyak kesalahan untuk rumah di atas 3.000 kaki persegi. kaki. Hal ini dikenal sebagai heteroskedastisitas.
Salah satu masalah paling umum dengan regresi linier ketika melihat industri real estat adalah korelasi kesalahan residual antara pengamatan. Anda dapat menganggap ini sebagai white noise yang tidak memiliki pola. Namun, jika ada pola pada residual, maka kemungkinan besar kita perlu melakukan penyesuaian. Masalah ini sulit untuk dikonseptualisasikan, tetapi ada dua bidang utama yang menjadi perhatian dalam industri real estat.
1. Autokorelasi
Membangun model berdasarkan pengamatan dalam jangka waktu yang lama tidak tepat untuk memprediksi nilai saat ini. Misalkan kita membangun model untuk memprediksi nilai properti hotel menggunakan tarif kamar rata-rata sebagai variabel independen. Kekuatan prediksi variabel ini bisa menyesatkan karena tarif kamar telah meningkat secara konsisten dari waktu ke waktu. Dalam istilah statistik, ada autokorelasi antara tarif kamar rata-rata yang diamati yang menunjukkan tren positif dari waktu ke waktu (yaitu inflasi) yang tidak akan diperhitungkan dalam model. Pendekatan penjualan sebanding tradisional yang paling banyak digunakan dalam real estat perumahan menghilangkan masalah ini dengan hanya menggunakan data terbaru. Karena jumlah transaksi komersial jauh lebih sedikit, pembatasan waktu ini sering membuat pendekatan penjualan yang sebanding menjadi tidak efektif. Namun, ada teknik menggunakan regresi linier yang dapat mengatasi masalah autokorelasi.
Efek klaster juga merupakan tantangan yang signifikan dalam pemodelan penilaian real estat. Ini dapat dianggap sebagai autokorelasi spasial. Cara termudah untuk memikirkan masalah ini adalah dengan membayangkan membangun model untuk memprediksi nilai rumah di dua lingkungan (A dan B) di kedua sisi jalan raya. Secara keseluruhan, model dapat bekerja dengan baik dalam memprediksi nilai, tetapi ketika kami memeriksa kesalahan residual, kami melihat ada pola. Rumah-rumah di lingkungan A umumnya sekitar 10% dinilai terlalu tinggi, dan rumah-rumah di lingkungan B kira-kira 10% kurang dihargai. Untuk meningkatkan model kami, kami perlu memperhitungkan efek cluster ini atau membangun satu model untuk setiap lingkungan.
2. Multikolinearitas
Idealnya, variabel dalam model tidak akan berkorelasi satu sama lain. Masalah ini dikenal disebut multikolinearitas. Menggunakan kedua kaki persegi dan jumlah tempat parkir sebagai masukan untuk model penilaian mal regional kemungkinan akan menunjukkan multikolinearitas. Ini intuitif karena kode perencanaan seringkali memerlukan sejumlah tempat parkir berdasarkan luas persegi ruang komersial. Dalam contoh ini, menghapus salah satu variabel akan memberikan penilaian yang lebih akurat dari model yang disesuaikan tanpa secara signifikan mengurangi daya prediksinya.
Pertimbangan lainnya
Menggunakan data yang diamati adalah inti dari setiap pendekatan empiris, tetapi penting untuk diingat bahwa hasil masa lalu tidak selalu memprediksi masa depan. Aset tidak likuid seperti real estat sangat rentan terhadap perubahan dalam siklus bisnis. Daya prediksi untuk variabel tertentu kemungkinan akan berubah berdasarkan kondisi ekonomi saat ini. Masalah ini tidak unik untuk regresi linier dan ditemukan dengan pendekatan tradisional juga.
Korelasi tidak sama dengan sebab akibat. Tujuan dari pembuatan model adalah untuk menemukan variabel yang berguna yang akan membuat prediksi yang valid. Anda harus waspada terhadap korelasi palsu. Anda mungkin terkejut mengetahui bahwa ada korelasi yang sangat kuat antara tingkat perceraian di Maine dan konsumsi margarin per kapita. Namun, menggunakan data perceraian dari Maine tidak masuk akal jika Anda mencoba memprediksi penjualan margarin di masa depan.
Contoh Kehidupan Nyata dari Penilaian Real Estat melalui Regresi
Mari sekarang menerapkan pengetahuan ini secara praktis dan membangun model linier dari awal hingga akhir. Untuk contoh kami, kami akan mencoba membangun model penilaian real estat yang memprediksi nilai rumah keluarga tunggal di Alleghany County, Pennsylvania. Pemilihan Alleghany County bersifat sewenang-wenang, dan para pelaku yang didemonstrasikan akan bekerja untuk lokasi mana pun. Kami akan menggunakan Excel dan SPSS, yang merupakan perangkat lunak statistik yang umum digunakan.
Menemukan data
Menemukan data berkualitas adalah langkah pertama dalam membangun model yang akurat dan mungkin yang paling penting. Meskipun kita semua pernah mendengar ungkapan “sampah masuk, sampah keluar”, penting untuk diingat bahwa tidak ada kumpulan data yang sempurna. Ini baik-baik saja selama kita dapat dengan nyaman mengasumsikan bahwa data sampel mewakili seluruh populasi. Ada tiga sumber utama data real estat:
- Sumber data pertama dan seringkali terbaik berasal dari lembaga pemerintah. Sebagian besar data ini gratis atau biayanya relatif rendah. Banyak perusahaan akan menagih Anda untuk data yang bisa Anda dapatkan dengan mudah secara gratis, jadi selalu lihat sekilas di internet sebelum membeli data. Pencarian web akan sering memberikan hasil dengan mencari kabupaten atau kota yang Anda cari dan kata-kata seperti "penilai pajak", "penilai pajak", "catatan real estat", atau "pencarian akta". Departemen Sistem Informasi Geografis (GIS) adalah salah satu bagian yang paling diabaikan dari banyak komunitas. Mereka sering memiliki banyak data yang dikumpulkan dari berbagai lembaga lokal lainnya. Sebagai pengembang real estat, saya sering mengandalkan bantuan mereka untuk menemukan data berkualitas tinggi yang saya gunakan untuk membuat model guna membantu menemukan properti baru untuk pengembangan. Organisasi pembangunan ekonomi juga dapat menjadi sumber data yang sangat baik.
- Vendor nirlaba adalah pilihan lain. Mereka sangat berguna saat Anda mencari data di beberapa area. Pastikan Anda melakukan pekerjaan rumah Anda sebelum membayar sejumlah besar uang untuk data mereka. Jangan hanya mengandalkan kumpulan data sampel mereka, karena dapat menyesatkan dalam hal kelengkapan. Jika Anda ragu tentang data apa yang mereka miliki, hubungi hubungi perwakilan secara langsung atau tanyakan tentang jaminan uang kembali.
- Terakhir, Multiple Listing Services (MLS) lokal adalah sumber daya yang tak ternilai. Sebagian besar properti dipasarkan melalui agen real estat yang merupakan anggota MLS. Umumnya, anggota MLS diharuskan untuk memasukkan semua daftar mereka ke dalam sistem lokal. Sayangnya, seringkali ada banyak batasan untuk bergabung dengan MLS, dan biaya akses data bisa sangat tinggi. Penting juga untuk memastikan Anda tidak melanggar persyaratan layanan saat menggunakan data mereka dan membuka diri terhadap potensi tanggung jawab.
Kami secara eksklusif akan menggunakan data gratis untuk contoh kami, yang bersumber dari Pusat Data Regional Pennsylvania Barat dan Biro Sensus AS. Data Penjualan Real Estat Alleghany akan memberi kami file dasar untuk pengamatan kami dengan harga jual sebagai variabel dependen kami (variabel Y). Kami juga akan menguji variabel menggunakan skor berjalan untuk setiap saluran sensus dan informasi penilaian pajak.

Satu variabel yang sangat berguna untuk dimiliki saat membangun model real estat adalah garis lintang dan garis bujur dari setiap alamat. Anda dapat memperoleh data ini melalui geocoder yang menggunakan alamat jalan untuk menetapkan garis lintang dan garis bujur. Geocoder Biro Sensus AS juga akan mengidentifikasi saluran sensus untuk setiap lokasi yang biasanya digunakan untuk mengumpulkan informasi demografis dan psikografis.
Menganalisis, mengubah, dan membuat variabel baru.
Sekarang kita telah memilih sumber data kita, kita perlu memeriksa kualitas data. Cara termudah untuk memeriksa kualitas data adalah dengan menjalankan tabel frekuensi untuk beberapa variabel kunci. Jika ada sejumlah besar entri yang hilang atau rusak, kami perlu memeriksa data lebih lanjut. Tabel di bawah ini menunjukkan bahwa hanya 1 dari 216.498 catatan yang memiliki kode pos yang hilang dalam file penjualan, dan tidak ada kode pos yang salah seperti 99999 atau 1X#45. Ini mungkin menunjukkan bahwa ini adalah kumpulan data berkualitas tinggi.
Kamus data adalah sumber yang bagus jika tersedia. Ini akan memberikan deskripsi tentang apa yang diukur setiap variabel, dan opsi yang memungkinkan untuk variabel tersebut. Data kami berisi analisis setiap penjualan yang dilakukan di daerah tersebut. Ini adalah informasi kunci, terutama ketika bekerja dengan catatan akta mentah. Semua transaksi real estat harus dicatat agar dapat ditegakkan oleh hukum, tetapi tidak semua transfer mencerminkan nilai pasar wajar properti yang sebenarnya. Misalnya, penjualan antara dua anggota keluarga dapat dilakukan dengan harga di bawah pasar sebagai bentuk hadiah atau untuk menghindari membayar biaya transaksi yang lebih tinggi seperti materai. Beruntung bagi kami, pemerintah daerah dengan jelas menandai transfer yang mereka yakini tidak mewakili nilai pasar saat ini, jadi kami hanya akan menggunakan catatan yang mencerminkan “penjualan yang valid”. Akun penjualan ini hanya sekitar 18% dari total jumlah transaksi, yang menggambarkan betapa pentingnya memahami data Anda sebelum Anda mulai menggunakannya untuk analisis. Berdasarkan pengalaman saya, rasio ini cukup umum ketika menganalisis catatan akta. Sangat mungkin jika kita membuat model yang menyertakan “penjualan tidak valid”, hasil akhir kita akan terdistorsi.
Selanjutnya, kami akan menambahkan data penilaian dan skor berjalan kami ke file penjualan. Ini memberi kita satu tabel untuk digunakan untuk model kita. Pada titik ini, kita perlu menganalisis variabel untuk melihat apakah variabel tersebut sesuai untuk regresi linier. Di bawah ini adalah tabel yang menunjukkan berbagai jenis variabel.
File kami berisi beberapa nilai nominal seperti lingkungan atau kode pos, yang mengkategorikan data tanpa urutan. Nilai nominal tidak sesuai untuk regresi linier tanpa transformasi. Ada juga beberapa variabel ordinal yang menilai kualitas konstruksi, kondisi properti saat ini, dll. Penggunaan data ordinal hanya sesuai jika kita dapat mengasumsikan bahwa setiap peringkat memiliki jarak yang sama. Misalnya, data kami memiliki variabel nilai dengan 19 klasifikasi berbeda (A+, A, A-, dll.), jadi kami dapat dengan aman mengasumsikan bahwa nilai ini kemungkinan memiliki jarak yang sama.
Ada juga beberapa variabel yang perlu diubah sebelum kita dapat menggunakannya dalam model. Salah satu nilai nominal yang dapat diubah menjadi variabel dummy untuk pengujian adalah variabel pemanasan dan pendinginan. Kami akan mengatur variabel ke 0 untuk semua properti tanpa AC dan properti dengan AC ke 1. Juga, nilai huruf perlu diubah menjadi angka (misalnya 0=Terburuk, 1=Lebih Baik, 2=Terbaik) untuk melihat jika ada hubungan linier dengan harga.
Akhirnya, kita perlu menentukan apakah tepat untuk menggunakan semua pengamatan. Kami ingin memprediksi nilai rumah terpisah satu keluarga, sehingga kami dapat menghilangkan semua properti komersial, kondominium, dan townhome dari data. Kami juga ingin menghindari potensi masalah dengan autokorelasi, jadi kami hanya menggunakan data penjualan tahun 2017 untuk membatasi kemungkinan terjadinya hal ini. Setelah kami menghilangkan semua catatan asing, kami memiliki kumpulan data akhir untuk diuji.
Pemilihan sampel dan variabel
Memilih ukuran sampel yang benar bisa jadi rumit. Di antara materi akademik, ada berbagai macam angka minimal yang disarankan dan berbagai aturan praktis. Untuk penelitian kami, populasi keseluruhan cukup besar, jadi kami tidak perlu khawatir memiliki cukup sampel. Sebaliknya, kami menanggung risiko memiliki sampel yang sangat besar sehingga hampir setiap variabel akan memiliki signifikansi statistik dalam model. Pada akhirnya, sekitar 10% dari catatan dipilih secara acak untuk pemodelan.
Pemilihan variabel dapat menjadi salah satu bagian tersulit dari proses tanpa perangkat lunak statistik. Namun, SPSS memungkinkan kita untuk dengan cepat membangun banyak model dari kombinasi variabel yang kita anggap sesuai untuk regresi linier. SPSS akan secara otomatis menyaring variabel berdasarkan ambang batas kami untuk signifikansi statistik dan hanya mengembalikan model terbaik.
Membangun model dan meninjau hasil
Dari data sampel kami, SPSS menghasilkan lima model. Model yang paling prediktif termasuk 5 variabel berikut.
- Grade berdasarkan kualitas konstruksi peringkat 1-19 (1=Sangat Buruk dan 19=Sangat Baik)
- Ruang Tamu Selesai
- AC (Ya/Tidak)
- Banyak ukuran
- Grade untuk kondisi fisik atau status perbaikan peringkat 1-8 (1=Tidak layak huni dan 8=sangat baik)
Mari kita lihat hasil dari SPSS. Fokus utama kami pada awalnya adalah pada nilai R-kuadrat yang memberi tahu kami berapa persentase varians dalam variabel dependen (harga) yang diprediksi oleh regresi. Nilai terbaik yang mungkin adalah 1, dan hasil model kami cukup menjanjikan. Kesalahan standar perkiraan yang mengukur ketepatan model terlihat cukup tinggi pada $73.091. Namun, jika kita membandingkannya dengan standar deviasi harga jual dalam model ($160.429), kesalahan tersebut tampaknya masuk akal.
SPSS memiliki fungsionalitas bawaan untuk menguji autokorelasi menggunakan Uji Durbin-Watson. Idealnya, nilainya adalah 2,0 pada skala 0 hingga 4, tetapi nilai 1,652 seharusnya tidak menimbulkan alarm.
Selanjutnya, kami menguji hasil model untuk menentukan apakah ada bukti heteroskedastisitas. Tidak ada fungsionalitas bawaan untuk SPSS, tetapi menggunakan makro yang ditulis oleh Ahmad Daryanto ini kita dapat menggunakan tes Breusch-Pagan dan Koenker. Pengujian ini menunjukkan bahwa terdapat heteroskedastisitas dalam model kami karena tingkat signifikansi (Sig) pada grafik di bawah ini di bawah 0,005. Model kami telah melanggar salah satu asumsi klasik regresi linier. Kemungkinan besar salah satu variabel dalam model perlu diubah untuk menghilangkan masalah. Namun, sebelum kita melakukan ini, ada baiknya untuk melihat apa efek heteroskedastisitas terhadap daya prediksi variabel independen kita. Melalui penggunaan makro yang dikembangkan oleh Andrew F. Hayes, kita dapat melihat kesalahan standar yang disesuaikan dan tingkat signifikansi untuk variabel independen kita.
Pengujian lebih lanjut mengungkapkan bahwa variabel independen tetap signifikan secara statistik, setelah memperhitungkan heteroskedastisitas dalam model, jadi kita tidak perlu mengubahnya untuk saat ini.
Uji dan perbaiki modelnya
Sebagai tes akhir, kami akan menilai semua catatan penjualan yang bukan merupakan bagian dari sampel asli dengan model kami. Ini akan membantu kita melihat bagaimana kinerja model pada kumpulan data yang lebih besar. Hasil pengujian ini menunjukkan bahwa nilai R-kuadrat dan kesalahan standar perkiraan tidak berubah secara signifikan pada kumpulan data besar, yang kemungkinan menunjukkan bahwa model kami akan berkinerja seperti yang diharapkan.
Jika kami ingin menggunakan model contoh kami dalam kehidupan nyata, kami kemungkinan akan mengelompokkan data lebih lanjut untuk memiliki beberapa model yang lebih tepat atau mencari data tambahan untuk meningkatkan ketepatan model tunggal ini. Langkah-langkah ini juga kemungkinan akan menghilangkan heteroskedastisitas yang kita lihat ada dalam model. Berdasarkan fakta bahwa kami mencoba menggunakan satu model untuk memprediksi nilai rumah di daerah berpenduduk lebih dari 1 juta orang, tidak mengherankan jika kami tidak dapat membangun model yang "sempurna" hanya dalam beberapa jam. .
Kesimpulan
Tujuan kami adalah membangun model yang memprediksi nilai rumah keluarga tunggal. Analisis kami menunjukkan bahwa kami mencapai tujuan itu dengan jumlah presisi yang masuk akal, tetapi apakah model kami masuk akal?
Jika kita menggambarkan model kita, kita akan mengatakan bahwa nilai sebuah rumah bergantung pada ukuran kavling, luas persegi rumah, kualitas konstruksi, kondisi perbaikan saat ini, dan apakah rumah tersebut memiliki AC. Hal ini tampaknya sangat masuk akal. Faktanya, jika kita membandingkan model kita dengan metode penilaian tradisional, kita melihat bahwa model ini sangat mirip dengan pendekatan biaya, yang menambahkan biaya untuk memperoleh tanah dan membangun gedung baru yang disesuaikan dengan keadaan usang saat ini. Namun, kesamaan ini mungkin, untuk menggunakan frase regresi, korelasi palsu.
Biasanya pendekatan biaya hanya direkomendasikan untuk menilai properti yang lebih baru, karena masalah dalam menentukan metode yang tepat untuk penyusutan properti yang lebih lama. Dengan model kami, kami telah membuat strategi serupa yang berguna untuk properti dari segala usia, pada kenyataannya, kami telah menguji usia sebagai variabel independen dan menyimpulkan bahwa itu tidak memiliki dampak signifikan secara statistik pada nilai properti!
Menggunakan Analisis Regresi untuk Bisnis Anda
Mudah-mudahan, sekarang, Anda memiliki pemahaman yang lebih baik tentang dasar-dasar analisis regresi. Pertanyaan selanjutnya adalah: dapatkah itu membantu bisnis Anda? Jika Anda menjawab ya untuk salah satu pertanyaan ini, maka Anda mungkin dapat mengambil manfaat dari menggunakan analisis regresi sebagai alat.
- Apakah Anda menginginkan pendekatan yang lebih ilmiah untuk menentukan nilai, membuat proyeksi, atau menganalisis pasar tertentu?
- Apakah Anda mencari cara yang lebih baik untuk mengidentifikasi potensi investasi real estat di area yang luas, wilayah, atau bahkan nasional?
- Apakah tujuan Anda untuk menarik pengecer besar, restoran, atau perusahaan perhotelan untuk proyek real estat komersial Anda?
- Apakah menurut Anda Anda berpotensi meningkatkan proses pengambilan keputusan dengan memasukkan poin data baru ke dalam proses?
- Apakah Anda khawatir tentang laba atas investasi Anda dalam pemasaran untuk pembeli dan investor?
Contoh model di atas adalah demonstrasi sederhana dari nilai penggunaan pemodelan regresi dalam real estat. 2-3 jam yang dibutuhkan untuk mengumpulkan data dan membangun model masih jauh dari menunjukkan potensi penuhnya. Dalam praktiknya, ada berbagai macam kegunaan untuk analisis regresi dalam industri real estat di luar penilaian properti termasuk:
- Analisis harga untuk daftar harga dan tarif sewa
- Analisis Demografis dan Psikografis pembeli dan penyewa perumahan.
- Mengidentifikasi target untuk pemasaran langsung
- Analisis ROI untuk kampanye pemasaran
Pemodelan geospasial menggunakan prinsip-prinsip analisis regresi yang dipasangkan dengan tiga hal terpenting dalam real estat: lokasi, lokasi, lokasi. Bekerja sebagai pengembang perumahan selama delapan tahun saya dapat membuktikan kekuatan pemodelan geospasial. Dengan menggunakan ArcGIS, saya dapat menggabungkan data penjualan, peta parsel, dan data lidar untuk menemukan properti yang ideal untuk pengembangan di pegunungan Carolina Utara.
Berdasarkan pengalaman saya, sebagian besar uang dalam real estat dibuat dalam akuisisi bukan pengembangan proyek. Mampu mengidentifikasi peluang yang dilewatkan orang lain dapat menjadi keunggulan kompetitif yang luar biasa dalam real estat. Analisis geospasial adalah sesuatu yang telah dimanfaatkan oleh perusahaan besar selama bertahun-tahun, tetapi perusahaan kecil sering mengabaikannya.
Cara Mengidentifikasi Mitra Analytics yang Tepat untuk Bisnis Anda
Sangat sedikit orang yang akan menilai statistik sebagai subjek favorit mereka. Faktanya, secara keseluruhan orang sangat buruk dalam memahami bahkan probabilitas dasar. Jika Anda ragu dengan pendapat ini, lakukan perjalanan ke Las Vegas atau Makau. Sayangnya, hal ini dapat mempersulit untuk menentukan siapa yang harus dipercaya ketika Anda mencari saran untuk menerapkan analisis regresi dalam proses Anda. Berikut adalah beberapa hal penting yang harus dicari ketika mengevaluasi kandidat potensial:
Sementara orang buruk dalam menilai probabilitas, intuisi sebenarnya lebih baik dalam mendeteksi kebohongan. Anda harus sangat skeptis terhadap siapa pun yang mengklaim mampu membangun model yang akan menjawab semua pertanyaan Anda! Jangan percaya jaminan hasil. Mudah-mudahan, artikel ini telah menggambarkan fakta bahwa analisis regresi didasarkan pada pengamatan empiris dan ilmu pengetahuan. Akan selalu terjadi bahwa hal-hal tertentu lebih mudah diprediksi daripada yang lain. Penasihat tepercaya akan terbuka dan jujur ketika mereka tidak dapat menemukan jawaban yang Anda cari, dan mereka tidak akan menghabiskan anggaran Anda untuk mencoba menemukan jawaban yang tidak ada.
Cari Mr. Spock bukan Kapten Kirk. Riset yang baik dapat menjadi alat pemasaran yang sangat baik, tetapi terlalu sering orang membayar materi pemasaran seksi dengan bau penelitian semu dan tidak ada logika untuk mendukungnya. Beberapa orang secara alami lebih analitis, tetapi keterampilan analitis yang hebat datang dari latihan. Idealnya, siapa pun yang Anda pekerjakan untuk menganalisis data untuk bisnis Anda akan memiliki pengalaman menemukan solusi untuk berbagai masalah. Seseorang dengan fokus yang sempit mungkin lebih rentan terhadap pemikiran kelompok, terutama ketika pengalaman mereka sangat mirip dengan pengalaman Anda.
Put potential candidates on the spot with questions that help demonstrate their reasoning abilities. This is not the time to rely on behavioral questions alone. Ideal candidates will have the ability to strategically use known information to reasonably estimate the answer to complex problems. Ask logical reasoning questions, like “How many tennis balls could you fit in the Empire State Building?”
Finally, you should look for someone with whom you can communicate. All of the information in the world won't help if you can't put it to good use. If someone uses so much jargon in an introductory conversation that your eyes start to glaze over, then they probably aren't the right fit for your company.