Valoración de Bienes Raíces Usando Análisis de Regresión – Un Tutorial
Publicado: 2022-03-11Resumen ejecutivo
El análisis de regresión ofrece un enfoque más científico para la valoración de bienes inmuebles
- Tradicionalmente, existen tres enfoques para valorar la propiedad: ventas, ingresos y costos comparables.
- Los modelos de regresión brindan una alternativa más flexible y objetiva. También es un proceso que, una vez que se crea un modelo, se vuelve autónomo, lo que permite a los empresarios inmobiliarios concentrarse en sus competencias principales.
- Se puede construir un modelo con numerosas variables que se prueban para determinar el impacto en el valor de una propiedad, como los pies cuadrados y la cantidad de dormitorios.
- Las regresiones no son una bala mágica. Siempre existe el peligro de que las variables contengan autocorrelación y/o multicolinealidad, o que la correlación entre variables sea espuria.
Ejemplo: construcción de un modelo de valoración de regresión para el condado de Allegheny, Pensilvania
- Hay una plétora de información inmobiliaria a la que se puede acceder electrónicamente para introducirla en los modelos. Las agencias gubernamentales, los proveedores de datos profesionales y los servicios de listado múltiple son tres de esas fuentes.
- Los volcados de datos iniciales requieren cierta limpieza para garantizar que no haya conjuntos de información irregulares. Por ejemplo, en nuestra muestra, se retiraron las casas que fueron transferidas como regalos, para no distorsionar los resultados del valor justo de mercado.
- Usando una muestra aleatoria del 10 % de los datos, SPSS arrojó las siguientes cinco variables como las más predictivas para el valor inmobiliario:
- Calificación basada en la calidad de la construcción clasificada del 1 al 19 (1=Muy pobre y 19=Excelente)
- Sala de estar terminada
- Aire Acondicionado (Si/No)
- Tamaño del lote
- Grado por condición física o estado de reparación clasificado 1-8
- Probar los resultados es fundamental, con la prueba de Durbin-Watson utilizada para la autocorrelación y la prueba de Breusch-Pagan para la heterocedasticidad. En nuestro modelo, hubo ligeras tendencias heteroscedásticas, lo que indica que la variabilidad de algunas variables fue desigual en todo el rango de valores.
¿Puede el análisis inmobiliario basado en regresión ser útil para su negocio?
- Aparte de la valoración de propiedades, el análisis de regresión dentro de los bienes raíces puede ser particularmente beneficioso en otras áreas:
- Las pruebas devuelven el rendimiento de acuerdos anteriores
- Análisis de precios para precios de catálogo y tarifas de alquiler
- Análisis demográfico y psicográfico de compradores e inquilinos residenciales
- Identificación de objetivos para el marketing directo.
- Análisis de ROI para campañas de marketing.
- Además, al evaluar candidatos para construir modelos de regresión, tenga cuidado con aquellos que prometen el mundo desde el primer día. La construcción de un modelo de regresión robusto es un proceso iterativo, así que en su lugar, céntrese en aquellos que son naturalmente curiosos y pueden pensar en el momento (es decir, pueden responder acertijos con un proceso de pensamiento).
Con demasiada frecuencia, en el sector inmobiliario, el proceso de valoración puede parecer un ejercicio intelectual de chuparse el dedo. El agente de bienes raíces vendrá, pateará los neumáticos proverbiales y luego producirá un valor estimado con muy poca información "cuantitativa". Quizás el proceso se ve exacerbado por el apego emocional que conlleva poseer una propiedad dado que, para muchos, una casa será la inversión financiera más grande que se haga en la vida.
Sin embargo, hay un método para esta locura. Bueno, tres para ser precisos.
¿Cómo se valora la propiedad?
El enfoque de ventas comparables es más común en bienes raíces residenciales y utiliza ventas recientes de propiedades similares para determinar el valor de una propiedad en cuestión. El precio de venta de los “comps” se ajusta en función de las diferencias entre ellos y la propiedad en cuestión. Por ejemplo, si una propiedad comparable tiene un baño adicional, el valor estimado del baño se resta de su precio de venta observado.
Se considera que los bienes raíces comerciales son más heterogéneos, por lo que el enfoque de ventas comparables se usa con menos frecuencia. El enfoque de ingresos, basado en el concepto de que el valor intrínseco de un activo es equivalente a la suma de todos sus flujos de efectivo descontados, se aplica más comúnmente a través de dos métodos:
- Similar al valor actual de una anualidad, el método de capitalización directa utiliza el ingreso operativo neto (NOI) de una propiedad dividido por la "tasa de capitalización" para establecer un valor. La tasa de capitalización contiene una tasa de descuento implícita y una tasa de crecimiento futuro de los ingresos operativos netos.
- El método de flujo de efectivo descontado proporciona el valor presente de los flujos de efectivo futuros durante un período de tiempo determinado, con un valor terminal que se estima utilizando una tasa de capitalización terminal.
La técnica final es el enfoque de costos, que estima el valor en función del costo de adquirir un terreno idéntico y construir una réplica de la propiedad en cuestión. Luego, el costo del proyecto se deprecia en función del estado actual de obsolescencia de la propiedad en cuestión. Similar a los ajustes en el enfoque de ventas comparables, el objetivo es igualar la propiedad en cuestión. El enfoque de costos se usa con menos frecuencia que los otros dos enfoques.
Todos los métodos tradicionales de valoración de bienes raíces son subjetivos, debido a la selección de las entradas utilizadas para la valoración. Por ejemplo, la elección de la tasa de capitalización tiene un impacto significativo en la valoración de una propiedad: al valorar una propiedad con un NOI de $ 1 millón, un aumento del 4% en la tasa de capitalización (del 6% al 10%) disminuirá el valor de la propiedad en un 40% (Gráfico Abajo).
Beneficios del uso de modelos de regresión en la valoración de bienes inmuebles
Hay numerosos beneficios al usar modelos de regresión para la valoración de bienes raíces. La industria minorista ha adoptado su uso para la selección de sitios, pero la industria inmobiliaria, en su mayor parte, ha pasado por alto sus ventajas potenciales. El análisis de regresión es particularmente adecuado para analizar grandes cantidades de datos. Sería prácticamente imposible tener un conocimiento sólido de todos los mercados inmobiliarios locales del país, pero los modelos de regresión pueden ayudar a acotar la búsqueda.
1. Flexibilidad
El mayor beneficio de usar modelos de regresión es su flexibilidad inherente: pueden funcionar independientemente de otros modelos o en concierto con ellos.
El enfoque más directo es utilizar los datos de ventas existentes para predecir el valor de una propiedad en cuestión, como resultado del modelo. Existen numerosas fuentes de datos gratuitos de agencias locales, estatales y federales que pueden complementarse con proveedores de datos privados.
Otra opción es utilizar modelos de regresión para predecir con mayor precisión las entradas de otros métodos de valoración tradicionales. Por ejemplo, al analizar un proyecto comercial de uso mixto, un desarrollador podría construir un modelo para predecir las ventas por pie cuadrado para el espacio comercial y otro modelo para predecir las tarifas de alquiler para el componente residencial. Ambos podrían usarse como entrada para un enfoque de ingresos para la valoración.
2. Enfoque objetivo
El uso de principios estadísticos sólidos produce un enfoque más objetivo de la valoración. Es una de las mejores formas de evitar el sesgo de confirmación, que ocurre cuando las personas buscan información que confirma su opinión preexistente o rechazan nueva información que la contradice. Cuando construí modelos para que los minoristas predijeran las ventas de nuevas tiendas, a menudo se sorprendieron al saber que muchos minoristas se benefician de estar cerca de un competidor. De hecho, la colocación con Walmart, que a menudo era su mayor competidor, fue una de las variables más comunes utilizadas en mis modelos. Confiar en los sesgos existentes puede generar oportunidades perdidas o, lo que es peor, ocultar desastres a la vuelta de la esquina.
Algunas de las ventajas objetivas de la valoración estadística son las siguientes:
- El análisis estadístico le permite determinar la importancia estadística (confiabilidad) de los factores individuales en el modelo.
- Si bien el análisis de escenarios o de sensibilidad puede brindarle una idea general sobre los cambios en las entradas en los métodos más tradicionales, se parece más a hacer múltiples predicciones que a brindarle una mejor idea de la precisión de la predicción original. Por otro lado, al construir un modelo de regresión, sabrá cuál será el rango de resultados en función de un cierto nivel de confianza.
Los modelos de regresión son únicos en el hecho de que tienen una verificación de precisión incorporada. Después de crear un modelo en una muestra de la población total, puede utilizar el modelo en datos fuera de la muestra para detectar un posible sesgo de muestreo.
3. Cumplir con su competencia principal
Todos los métodos de valoración tradicionales tienen un riesgo significativo de sesgo de selección. Al elegir propiedades comparables, es muy fácil caer en la trampa de seleccionar los mejores resultados y asumir que se parecen más a su proyecto. También se hace hincapié en la predicción de variables, como la tasa de rendimiento en el enfoque de ingresos. Eliminar la necesidad de esta predicción podría ser atractivo para muchos inversores inmobiliarios, razón por la cual la valoración basada en regresión es un enfoque útil.
Problemas potenciales con el análisis de regresión
La cantidad de chistes que citan los diferentes porcentajes de estadísticas que se componen es de hecho una broma en sí misma. Somos bombardeados casi todos los días con titulares de los medios sobre los resultados de un nuevo estudio de investigación, muchos de los cuales parecen contradecir un estudio publicado el año pasado. En un mundo de fragmentos de sonido, no hay tiempo para discutir la rigurosidad de los métodos empleados por los investigadores.
Hay muchos tipos de análisis de regresión, pero el más común es la regresión lineal. Hay ciertos supuestos sobre las regresiones lineales que no deben violarse para considerar que el modelo es válido. La violación de estas suposiciones distorsiona las pruebas estadísticas que calculan el poder predictivo de las entradas y el modelo general.
Supuestos de regresión lineal
Debe haber una relación lineal entre las entradas (variables independientes) y la salida (variable dependiente). Por ejemplo, podríamos suponer que existe una relación lineal entre los pies cuadrados con calefacción en una casa y su valor total. Sin embargo, debido a los rendimientos decrecientes, podríamos descubrir que la relación no es lineal, lo que requiere una transformación de los datos sin procesar.
Las variables independientes no deben ser aleatorias. En pocas palabras, las observaciones de cada variable independiente en el modelo son fijas y se supone que no tienen errores en su medición. Por ejemplo, si usamos el número de unidades para modelar el valor de un edificio de departamentos, todos los edificios en nuestros datos de muestra tendrán un número fijo de unidades que no cambiará, independientemente de cómo construyamos el modelo.
Los "residuales" del modelo (es decir, la diferencia entre el resultado predicho del modelo y las observaciones reales) sumarán 0, o en términos más simples: el modelo que usaremos representará la línea de mejor ajuste.
El modelo debe ser preciso para todas las observaciones de cada variable independiente. Si predijéramos el valor de una casa en función de sus pies cuadrados, no querríamos usar el modelo si fuera extremadamente preciso para predecir valores para casas de menos de 1,500 pies cuadrados, pero hubo una gran cantidad de error para casas de más de 3,000 pies cuadrados. pies cuadrados. Esto se conoce como heterocedasticidad.
Uno de los problemas más comunes con la regresión lineal al observar la industria de bienes raíces es una correlación de errores residuales entre las observaciones. Puede pensar en esto como un ruido blanco que no tiene patrón. Sin embargo, si hay un patrón en los residuos, lo más probable es que necesitemos hacer un ajuste. Este problema es difícil de conceptualizar, pero hay dos áreas principales donde esto es una preocupación en la industria de bienes raíces.
1. Autocorrelación
Construir un modelo basado en observaciones durante un largo período de tiempo sería inapropiado para predecir valores actuales. Supongamos que construimos un modelo para predecir el valor de la propiedad de un hotel usando la tarifa promedio de la habitación como variable independiente. El poder predictivo de esta variable podría ser engañoso porque las tarifas de las habitaciones han aumentado constantemente a lo largo del tiempo. En términos estadísticos, existe una autocorrelación entre las tarifas de habitación promedio observadas que muestran una tendencia positiva a lo largo del tiempo (es decir, la inflación) que no se tendría en cuenta en el modelo. El enfoque tradicional de ventas comparables más utilizado en bienes raíces residenciales elimina este problema al usar solo los datos más recientes. Dado que hay un número mucho menor de transacciones comerciales, esta restricción de tiempo a menudo hace que el enfoque de ventas comparables sea ineficaz. Sin embargo, existen técnicas que utilizan regresión lineal que pueden superar los problemas de autocorrelación.
El efecto clúster también es un desafío importante en la modelización de la valoración de bienes inmuebles. Esto se puede considerar como una autocorrelación espacial. La forma más sencilla de pensar en este problema es imaginar la construcción de un modelo para predecir el valor de las casas en dos vecindarios (A y B) a ambos lados de una carretera. Como un todo, el modelo puede funcionar bien para predecir valores, pero cuando examinamos los errores residuales, notamos que hay un patrón. Las casas en el vecindario A generalmente están sobrevaluadas en un 10% y las casas en el vecindario B están subvaluadas en aproximadamente un 10%. Para mejorar nuestro modelo, debemos tener en cuenta este efecto de conglomerado o construir un modelo para cada vecindario.
2. Multicolinealidad
Idealmente, las variables dentro de un modelo no estarán correlacionadas entre sí. Este problema conocido se llama multicolinealidad. El uso de pies cuadrados y la cantidad de lugares de estacionamiento como entradas para un modelo que valora los centros comerciales regionales probablemente demostraría multicolinealidad. Esto es intuitivo porque los códigos de planificación a menudo requieren una cierta cantidad de lugares de estacionamiento en función de los pies cuadrados de un espacio comercial. En este ejemplo, eliminar una de las variables daría una evaluación más precisa del modelo ajustado sin reducir significativamente su poder predictivo.
Otras Consideraciones
El uso de datos observados es el núcleo de cualquier enfoque empírico, pero es importante recordar que los resultados pasados no siempre predicen el futuro. Los activos ilíquidos como los bienes raíces son particularmente vulnerables a los cambios en el ciclo económico. Es probable que el poder predictivo de ciertas variables cambie según las condiciones económicas actuales. Este problema no es exclusivo de la regresión lineal y también se encuentra con los enfoques tradicionales.
Correlación no es igual a causalidad. El propósito de la construcción de modelos es encontrar variables útiles que hagan predicciones válidas. Debe tener cuidado con las correlaciones espurias. Es posible que se sorprenda al saber que existe una correlación extremadamente fuerte entre la tasa de divorcios en Maine y el consumo per cápita de margarina. Sin embargo, usar los datos de divorcio de Maine no tendría sentido si estuviera tratando de predecir las ventas futuras de margarina.
Un ejemplo de la vida real de valoración de bienes raíces a través de regresión
Apliquemos ahora este conocimiento de manera práctica y construyamos un modelo lineal de principio a fin. Para nuestro ejemplo, intentaremos construir un modelo de valoración de bienes raíces que prediga el valor de viviendas unifamiliares independientes en el condado de Alleghany, Pensilvania. La elección del condado de Alleghany es arbitraria y los directores demostrados funcionarán para cualquier ubicación. Usaremos Excel y SPSS, que es un software estadístico de uso común.
Encontrar datos
Encontrar datos de calidad es el primer paso para construir un modelo preciso y quizás el más importante. Aunque todos hemos escuchado la frase "si entra basura, sale basura", es importante recordar que no existe un conjunto de datos perfecto. Esto está bien siempre que podamos asumir cómodamente que los datos de la muestra son representativos de toda la población. Hay tres fuentes principales de datos inmobiliarios:
- La primera y, a menudo, la mejor fuente de datos proviene de las agencias gubernamentales. Gran parte de estos datos son gratuitos o tienen un costo relativamente bajo. Muchas compañías le cobrarán por datos que podría obtener fácilmente de forma gratuita, así que siempre eche un vistazo rápido a Internet antes de comprar datos. Una búsqueda en la web a menudo arrojará resultados al buscar el condado o la ciudad que está buscando y palabras como "asesor de impuestos", "tasaciones de impuestos", "registros de bienes raíces" o "búsqueda de escrituras". Los departamentos de Sistemas de Información Geográfica (SIG) son una de las partes más ignoradas de muchas comunidades. A menudo tienen gran parte de los datos agregados de varias otras agencias locales. Como desarrollador de bienes raíces, a menudo confiaba en su ayuda para encontrar datos de alta calidad que usaba para construir modelos para ayudar a localizar nuevas propiedades para el desarrollo. Las organizaciones de desarrollo económico también pueden ser una excelente fuente de datos.
- Los vendedores con fines de lucro son otra opción. Son particularmente útiles cuando busca datos en múltiples áreas. Asegúrese de hacer su tarea antes de pagar grandes sumas de dinero por sus datos. No confíe solo en sus conjuntos de datos de muestra, ya que podría ser engañoso en términos de integridad. Si tiene dudas sobre qué datos tienen disponibles, comuníquese con un representante directamente o pregunte sobre una garantía de devolución de dinero.
- Finalmente, los Servicios de Listado Múltiple (MLS) locales son un recurso invaluable. La mayoría de las propiedades se comercializan a través de un agente de bienes raíces que es miembro de una MLS. Por lo general, los miembros de una MLS deben ingresar todos sus listados en el sistema local. Desafortunadamente, a menudo existen muchas restricciones para unirse a un MLS y el costo del acceso a los datos puede ser bastante alto. También es importante asegurarse de no violar los términos de servicio al usar sus datos y exponerse a posibles responsabilidades.
Usaremos exclusivamente datos gratuitos para nuestro ejemplo, obtenidos del Centro de datos regional de Pensilvania occidental y la Oficina del censo de EE. UU. Los datos de Ventas de Bienes Raíces de Alleghany nos darán un archivo base para nuestras observaciones con el precio de venta como nuestra variable dependiente (variable Y). También probaremos las variables utilizando el puntaje de caminata para cada tramo censal e información de tasación de impuestos.

Una variable muy útil a la hora de construir modelos inmobiliarios es la latitud y la longitud de cada dirección. Puede obtener estos datos a través de un geocodificador que utiliza una dirección de calle para asignar una latitud y longitud. El geocodificador de la Oficina del Censo de los EE. UU. también identificará el sector del censo para cada ubicación que se usa comúnmente para agregar información demográfica y psicográfica.
Analizar, transformar y crear nuevas variables.
Ahora que hemos seleccionado nuestras fuentes de datos, necesitamos examinar la calidad de los datos. La forma más fácil de verificar la calidad de los datos es ejecutar una tabla de frecuencia para algunas variables clave. Si hay una cantidad significativa de entradas faltantes o corruptas, tendremos que examinar más los datos. La siguiente tabla muestra que solo 1 de 216 498 registros tiene un código postal faltante en el archivo de ventas y no hay códigos postales erróneos como 99999 o 1X#45. Esto probablemente indica que se trata de un conjunto de datos de alta calidad.
Un diccionario de datos es un excelente recurso cuando está disponible. Dará una descripción de lo que mide cada variable y posibles opciones para la variable. Nuestros datos contienen un análisis de cada venta realizada en el condado. Esta es información clave, especialmente cuando se trabaja con registros de escrituras sin procesar. Todas las transacciones de bienes raíces deben registrarse para que se puedan hacer cumplir por ley, pero no todas las transferencias reflejan el verdadero valor justo de mercado de una propiedad. Por ejemplo, una venta entre dos miembros de la familia podría ser a un precio por debajo del mercado como una forma de regalo o para evitar pagar costos de transacción más altos, como sellos de escritura. Afortunadamente para nosotros, el gobierno local marca claramente las transferencias que cree que no son representativas de los valores de mercado actuales, por lo que solo usaremos registros que reflejen una "venta válida". Estas ventas representan solo alrededor del 18% del número total de transacciones, lo que ilustra lo importante que es comprender sus datos antes de comenzar a usarlos para el análisis. Según mi experiencia, esta proporción es bastante común cuando se analizan registros de escrituras. Es muy probable que si construimos un modelo que incluya las "ventas no válidas", nuestros resultados finales se distorsionarán.
A continuación, agregaremos nuestros datos de evaluación y puntajes de caminata al archivo de ventas. Esto nos da una sola tabla para usar en nuestro modelo. En este punto, necesitamos analizar las variables para ver si son apropiadas para la regresión lineal. A continuación se muestra una tabla que muestra varios tipos de variables.
Nuestro archivo contiene varios valores nominales como vecindario o código postal, que categorizan datos sin sentido de orden. Los valores nominales son inapropiados para la regresión lineal sin transformación. También hay varias variables ordinales que califican la calidad de la construcción, la condición actual de la propiedad, etc. El uso de datos ordinales solo es apropiado cuando podemos suponer razonablemente que cada rango está espaciado uniformemente. Por ejemplo, nuestros datos tienen una variable de calificación con 19 clasificaciones diferentes (A+, A, A-, etc.), por lo que podemos suponer con seguridad que estas calificaciones probablemente estén espaciadas uniformemente.
También hay varias variables que deben transformarse antes de que podamos usarlas en el modelo. Un valor nominal que se puede transformar en una variable ficticia para la prueba es la variable de calefacción y refrigeración. Estableceremos la variable en 0 para todas las propiedades sin aire acondicionado y para aquellas con aire acondicionado en 1. Además, las calificaciones con letras deben convertirse en números (p. ej., 0=peor, 1=mejor, 2=mejor) para poder ver si existe una relación lineal con el precio.
Finalmente, necesitamos determinar si es apropiado usar todas las observaciones. Queremos predecir los valores de las viviendas unifamiliares independientes, para poder eliminar todas las propiedades comerciales, condominios y casas adosadas de los datos. También queremos evitar posibles problemas con la autocorrelación, por lo que solo usamos datos de ventas en 2017 para limitar la probabilidad de que esto ocurra. Después de eliminar todos los registros extraños, tenemos nuestro conjunto de datos final para probar.
Selección de muestras y variables
Seleccionar el tamaño de muestra correcto puede ser complicado. Entre los materiales académicos, se sugiere una amplia gama de números mínimos y varias reglas generales. Para nuestro estudio, la población general es bastante grande, por lo que no debemos preocuparnos por tener suficiente para una muestra. En cambio, corremos el riesgo de tener una muestra tan grande que casi todas las variables tendrán una significancia estadística en el modelo. Al final, alrededor del 10 % de los registros se seleccionaron al azar para el modelado.
La selección de variables puede ser una de las partes más difíciles del proceso sin software estadístico. Sin embargo, SPSS nos permite construir rápidamente muchos modelos a partir de una combinación de variables que hemos considerado apropiadas para una regresión lineal. SPSS filtrará automáticamente las variables en función de nuestros umbrales de significancia estadística y devolverá solo los mejores modelos.
Construyendo el modelo y revisando los resultados
A partir de nuestros datos de muestra, SPSS produjo cinco modelos. El modelo que fue más predictivo incluyó las siguientes 5 variables.
- Calificación basada en la calidad de la construcción clasificada del 1 al 19 (1=Muy pobre y 19=Excelente)
- Sala de estar terminada
- Aire Acondicionado (Si/No)
- Tamaño del lote
- Grado de condición física o estado de conservación del 1 al 8 (1=Inhabitable y 8=excelente)
Echemos un vistazo a los resultados de SPSS. Nuestro enfoque principal estará inicialmente en el valor R-cuadrado que nos dice qué porcentaje de variación en la variable dependiente (precio) predice la regresión. El mejor valor posible sería 1, y el resultado de nuestro modelo es bastante prometedor. El error estándar de la estimación que mide la precisión del modelo parece ser bastante alto en $73,091. Sin embargo, si comparamos eso con la desviación estándar del precio de venta en el modelo ($160,429), el error parece razonable.
SPSS tiene una funcionalidad integrada para probar la autocorrelación mediante la prueba de Durbin-Watson. Idealmente, el valor sería 2,0 en una escala de 0 a 4, pero un valor de 1,652 no debería causar alarma.
A continuación, probamos los resultados del modelo para determinar si hay evidencia de heteroscedasticidad. No hay funcionalidad integrada para SPSS, pero usando esta macro escrita por Ahmad Daryanto podemos usar las pruebas de Breusch-Pagan y Koenker. Estas pruebas muestran que hay heterocedasticidad presente en nuestro modelo ya que el nivel de significación (Sig) en el gráfico a continuación está por debajo de .005. Nuestro modelo ha violado uno de los supuestos clásicos de la regresión lineal. Lo más probable es que una de las variables del modelo deba transformarse para eliminar el problema. Sin embargo, antes de hacer esto, es una buena idea ver cuáles son los efectos de la heterocedasticidad en el poder predictivo de nuestras variables independientes. Mediante el uso de una macro desarrollada por Andrew F. Hayes, podemos observar los errores estándar ajustados y los niveles de significación de nuestras variables independientes.
Pruebas adicionales revelan que las variables independientes siguen siendo estadísticamente significativas, después de tener en cuenta la heterocedasticidad en el modelo, por lo que no necesariamente tenemos que modificarlo por ahora.
Probar y refinar el modelo.
Como prueba final, calificaremos todos los registros de ventas que no formaban parte de la muestra original con nuestro modelo. Esto nos ayudará a ver cómo funciona el modelo en un conjunto de datos más grande. Los resultados de esta prueba muestran que el valor R-cuadrado y el error estándar de la estimación no cambiaron significativamente en el gran conjunto de datos, lo que probablemente indica que nuestro modelo funcionará como se esperaba.
Si quisiéramos usar nuestro modelo de ejemplo en la vida real, probablemente segmentaríamos aún más los datos para tener varios modelos que fueran más precisos o buscaríamos datos adicionales para mejorar la precisión de este único modelo. Es probable que estos pasos también eliminen la heterocedasticidad que vimos presente en el modelo. Basado en el hecho de que intentábamos usar un solo modelo para predecir el valor de las casas en un condado con más de 1 millón de habitantes, no debería sorprendernos que no pudiéramos construir el modelo "perfecto" en solo un par de horas. .
Conclusiones
Nuestro objetivo era construir un modelo que predijera el valor de las viviendas unifamiliares independientes. Nuestro análisis muestra que logramos ese objetivo con una cantidad razonable de precisión, pero ¿tiene sentido nuestro modelo?
Si tuviéramos que describir nuestro modelo, diríamos que el valor de una casa depende del tamaño del lote, los pies cuadrados de la casa, la calidad de la construcción, el estado actual de reparación y si tiene o no aire acondicionado. Esto parece muy razonable. De hecho, si comparamos nuestro modelo con los métodos de valoración tradicionales, vemos que es muy similar al enfoque de costos, que agrega el costo de adquirir un terreno y construir un nuevo edificio ajustado por el estado actual de obsolescencia. Sin embargo, esta similitud podría ser, para usar una frase de regresión, una correlación espuria.
Por lo general, el enfoque de costo solo se recomienda para valuar propiedades más nuevas, debido a problemas para determinar el método apropiado para la depreciación de propiedades más antiguas. Con nuestro modelo, hemos creado una estrategia similar que es útil para propiedades de cualquier edad, de hecho, hemos probado la edad como una variable independiente y concluimos que no tiene un impacto estadísticamente significativo en el valor de las propiedades.
Uso del análisis de regresión para su negocio
Es de esperar que, a estas alturas, tenga una mejor comprensión de los conceptos básicos del análisis de regresión. La siguiente pregunta es: ¿puede ayudar a su negocio? Si responde afirmativamente a cualquiera de estas preguntas, entonces probablemente podría beneficiarse del uso del análisis de regresión como herramienta.
- ¿Quiere un enfoque más científico para determinar el valor, hacer proyecciones o analizar un mercado en particular?
- ¿Está buscando mejores formas de identificar posibles inversiones inmobiliarias en grandes áreas, regiones o incluso en todo el país?
- ¿Su objetivo es atraer a grandes minoristas, restaurantes o empresas hoteleras para su proyecto de bienes raíces comerciales?
- ¿Cree que podría mejorar potencialmente su proceso de toma de decisiones al incorporar nuevos puntos de datos en el proceso?
- ¿Le preocupa el retorno de su inversión en marketing para compradores e inversores?
El modelo de ejemplo anterior es una demostración simple del valor de usar modelos de regresión en bienes raíces. Las 2-3 horas que tomó recopilar los datos y construir el modelo están lejos de mostrar todo su potencial. En la práctica, hay una amplia variedad de usos para el análisis de regresión en la industria de bienes raíces más allá de la valoración de propiedades, que incluyen:
- Análisis de precios para precios de catálogo y tarifas de alquiler
- Análisis demográfico y psicográfico de compradores e inquilinos residenciales.
- Identificación de objetivos para el marketing directo.
- Análisis de ROI para campañas de marketing.
El modelado geoespacial utiliza los principios del análisis de regresión junto con las tres cosas más importantes en bienes raíces: ubicación, ubicación, ubicación. Trabajando como desarrollador residencial durante ocho años, puedo dar fe del poder del modelado geoespacial. Con ArcGIS, pude incorporar datos de ventas, mapas de parcelas y datos LIDAR para encontrar propiedades ideales para el desarrollo en las montañas de Carolina del Norte.
Según mi experiencia, la mayor parte del dinero en bienes raíces se obtiene en la adquisición, no en el desarrollo de un proyecto. Ser capaz de identificar oportunidades que otros pierden puede ser una gran ventaja competitiva en el sector inmobiliario. El análisis geoespacial es algo que las grandes empresas han aprovechado durante muchos años, pero las empresas más pequeñas suelen pasar por alto.
Cómo identificar al socio de análisis adecuado para su empresa
Muy pocas personas calificarían la estadística como su materia favorita. De hecho, en general, las personas son muy malas para comprender incluso las probabilidades básicas. Si tiene dudas sobre esta opinión, haga un viaje a Las Vegas o Macao. Desafortunadamente, esto puede hacer que sea difícil determinar en quién confiar cuando busca consejos sobre cómo implementar el análisis de regresión en su proceso. Aquí hay algunas cosas clave a tener en cuenta al evaluar candidatos potenciales
Si bien las personas son malas para juzgar las probabilidades, la intuición es bastante buena para detectar mentiras. ¡Debe ser muy escéptico con cualquiera que afirme poder construir un modelo que responda a todas sus preguntas! No confíe en una garantía de resultados. Con suerte, este artículo ha ilustrado el hecho de que el análisis de regresión se basa en la observación empírica y la ciencia sólida. Siempre se dará el caso de que ciertas cosas sean más fáciles de predecir que otras. Un asesor de confianza será abierto y honesto cuando no pueda encontrar las respuestas que está buscando, y no gastará su presupuesto tratando de encontrar una que no esté allí.
Busque al Sr. Spock en lugar del Capitán Kirk. La investigación sólida puede ser una excelente herramienta de marketing, pero con demasiada frecuencia la gente paga por materiales de marketing atractivos con un toque de pseudo-investigación y sin lógica que lo respalde. Algunas personas son naturalmente más analíticas, pero las grandes habilidades analíticas provienen de la práctica. Idealmente, cualquier persona que contrate para analizar datos para su negocio tendrá experiencia en encontrar soluciones a una amplia variedad de problemas. Alguien con un enfoque limitado puede ser más susceptible al pensamiento de grupo, especialmente cuando sus experiencias son similares a las suyas.
Put potential candidates on the spot with questions that help demonstrate their reasoning abilities. This is not the time to rely on behavioral questions alone. Ideal candidates will have the ability to strategically use known information to reasonably estimate the answer to complex problems. Ask logical reasoning questions, like “How many tennis balls could you fit in the Empire State Building?”
Finally, you should look for someone with whom you can communicate. All of the information in the world won't help if you can't put it to good use. If someone uses so much jargon in an introductory conversation that your eyes start to glaze over, then they probably aren't the right fit for your company.