Avaliação de Imóveis Usando Análise de Regressão – Um Tutorial

Publicados: 2022-03-11

Sumário executivo

A análise de regressão oferece uma abordagem mais científica para avaliação de imóveis
  • Tradicionalmente, existem três abordagens para avaliar a propriedade: vendas comparáveis, receita e custo.
  • Os modelos de regressão oferecem uma alternativa mais flexível e objetiva. É também um processo que, uma vez feito um modelo, torna-se autônomo, permitindo que os empreendedores imobiliários se concentrem em suas competências essenciais.
  • Um modelo pode ser construído com inúmeras variáveis ​​que são testadas quanto ao impacto no valor de uma propriedade, como metragem quadrada e número de quartos.
  • As regressões não são uma bala mágica. Há sempre o perigo de que as variáveis ​​contenham autocorrelação e/ou multicolinearidade, ou que a correlação entre variáveis ​​seja espúria.
Exemplo: construção de um modelo de avaliação de regressão para Allegheny County, Pensilvânia
  • Há uma infinidade de informações imobiliárias que podem ser acessadas eletronicamente para serem inseridas em modelos. Agências governamentais, provedores de dados profissionais e serviços de listagem múltipla são três dessas fontes.
  • Os dumps de dados iniciais exigem alguma limpeza para garantir que não haja conjuntos irregulares de informações. Por exemplo, em nossa amostra, as casas que foram transferidas como presentes foram retiradas, para não distorcer os resultados do valor justo de mercado.
  • Usando uma amostra aleatória de 10% dos dados, o SPSS retornou as cinco variáveis ​​a seguir como sendo mais preditivas para o valor imobiliário:
    • Nota com base na qualidade da construção classificada de 1 a 19 (1 = Muito ruim e 19 = Excelente)
    • Área de Estar Acabada
    • Ar Condicionado (Sim/Não)
    • Tamanho do Lote
    • Grau para condição física ou estado de reparo classificado de 1 a 8
  • Testar os resultados é fundamental, com o teste de Durbin-Watson usado para autocorrelação e o teste de Breusch-Pagan para heterocedasticidade. Em nosso modelo, houve ligeiras tendências heterocedásticas, o que indica que a variabilidade de algumas variáveis ​​foi desigual em toda a faixa de valores.
A análise imobiliária baseada em regressão pode ser útil para o seu negócio?
  • Além de avaliar propriedades, a análise de regressão dentro de imóveis pode ser particularmente benéfica em outras áreas:
    • O teste retorna o desempenho em negócios anteriores
    • Análise de preços para preços de tabela e taxas de aluguel
    • Análise demográfica e psicográfica de compradores e inquilinos residenciais
    • Identificando alvos para marketing direto
    • Análise de ROI para campanhas de marketing
  • Além disso, ao avaliar candidatos para construir modelos de regressão, desconfie daqueles que prometem o mundo desde o primeiro dia. Construir um modelo de regressão robusto é um processo iterativo, portanto, concentre-se naqueles que são naturalmente curiosos e podem pensar no local (ou seja, podem responder a quebra-cabeças com um processo de pensamento).

Muitas vezes, no setor imobiliário, o processo de avaliação pode parecer um exercício intelectual de chupar o dedo. O corretor de imóveis virá, chutará os pneus proverbiais e, em seguida, produzirá um valor estimado com muito pouca percepção “quantitativa”. Talvez o processo seja exacerbado pelo apego emocional que a posse de um imóvel traz, já que para muitos, uma casa será o maior investimento financeiro feito na vida.

No entanto, há um método para essa loucura. Bem, três para ser preciso.

Como o imóvel é avaliado?

A abordagem de vendas comparáveis ​​é mais comum em imóveis residenciais e usa vendas recentes de propriedades semelhantes para determinar o valor de uma propriedade em questão. Os preços de venda dos “comps” são ajustados com base nas diferenças entre eles e o imóvel em questão. Por exemplo, se uma propriedade comparável tiver um banheiro adicional, o valor estimado do banheiro será subtraído do preço de venda observado.

Os imóveis comerciais são considerados mais heterogêneos, portanto, a abordagem de vendas comparáveis ​​é usada com menos frequência. A abordagem de renda, baseada no conceito de que o valor intrínseco de um ativo é equivalente à soma de todos os seus fluxos de caixa descontados, é mais comumente aplicada em dois métodos:

  1. Semelhante ao valor presente de uma anuidade, o método de capitalização direta usa a receita operacional líquida (NOI) de uma propriedade dividida pelo “cap rate” para estabelecer um valor. O cap rate contém uma taxa de desconto implícita e uma taxa de crescimento futuro da receita operacional líquida.
  2. O método de fluxo de caixa descontado fornece o valor presente dos fluxos de caixa futuros ao longo de um determinado período de tempo, com um valor terminal que é estimado usando uma taxa de capitalização terminal.

A técnica final é a abordagem de custo, que estima o valor com base no custo de adquirir um terreno idêntico e construir uma réplica da propriedade em questão. Em seguida, o custo do projeto é depreciado com base no estado atual de obsolescência do imóvel em questão. Semelhante aos ajustes na abordagem de vendas comparáveis, o objetivo é aproximar-se da propriedade em questão. A abordagem de custo é usada com menos frequência do que as outras duas abordagens.

Todos os métodos tradicionais de avaliação de imóveis são subjetivos, devido à seleção dos insumos utilizados para avaliação. Por exemplo, a escolha do cap rate tem um impacto significativo na avaliação de um imóvel: ao avaliar um imóvel com um NOI de $ 1M, um aumento de 4% no cap rate (de 6% para 10%) diminuirá o valor do o imóvel em 40% (Gráfico Abaixo).

cap rate tem um impacto desproporcional na avaliação de imóveis

Benefícios do Uso de Modelos de Regressão na Avaliação Imobiliária

Existem inúmeros benefícios em usar modelos de regressão para avaliação de imóveis. O setor de varejo adotou seu uso para a seleção de locais, mas o setor imobiliário, na maioria das vezes, negligenciou suas vantagens potenciais. A análise de regressão é particularmente adequada para analisar grandes quantidades de dados. Seria praticamente impossível ter um conhecimento profundo de todos os mercados imobiliários locais do país, mas a modelagem de regressão pode ajudar a estreitar a busca.

1. Flexibilidade

O maior benefício de usar a modelagem de regressão é sua flexibilidade inerente - eles podem trabalhar independentemente de outros modelos ou em conjunto com eles.

A abordagem mais direta é usar os dados de vendas existentes para prever o valor de uma propriedade em questão, como uma saída para o modelo. Existem inúmeras fontes de dados gratuitos de agências locais, estaduais e federais que podem ser complementadas com provedores de dados privados.

Outra opção é usar modelos de regressão para prever com mais precisão as entradas para outros métodos tradicionais de avaliação. Por exemplo, ao analisar um projeto comercial de uso misto, um desenvolvedor pode construir um modelo para prever as vendas por metro quadrado para o espaço de varejo e outro modelo para prever as taxas de aluguel para o componente residencial. Ambos podem ser usados ​​como entrada para uma abordagem de renda para avaliação.

2. Abordagem objetiva

O uso de princípios estatísticos sólidos resulta em uma abordagem mais objetiva da avaliação. É uma das melhores maneiras de evitar o viés de confirmação, que ocorre quando as pessoas buscam informações que confirmam sua opinião preexistente ou rejeitam novas informações que a contradizem. Quando construí modelos para os varejistas preverem as vendas de novas lojas, eles muitas vezes ficaram surpresos ao saber que muitos varejistas se beneficiam de estar perto de um concorrente. Na verdade, a colocação com o Walmart, que muitas vezes era seu maior concorrente, era uma das variáveis ​​mais comuns usadas em meus modelos. Confiar em preconceitos existentes pode levar a oportunidades perdidas ou, pior ainda, ocultar desastres ao virar da esquina.

Algumas das vantagens objetivas da avaliação estatística são as seguintes:

  1. A análise estatística permite determinar a significância estatística (confiabilidade) de fatores individuais no modelo.
  2. Embora a análise de cenário ou sensibilidade possa fornecer uma ideia geral sobre as alterações nas entradas em métodos mais tradicionais, é mais semelhante a fazer várias previsões em vez de fornecer uma ideia melhor da precisão da previsão original. Por outro lado, ao construir um modelo de regressão, você saberá qual será a faixa de resultados com base em um certo nível de confiança.

Os modelos de regressão são únicos pelo fato de terem uma verificação integrada de precisão. Depois de construir um modelo em uma amostra da população total, você pode usar o modelo em dados fora da amostra para detectar possíveis vieses de amostragem.

3. Aderindo à sua competência essencial

Todos os métodos tradicionais de avaliação têm um risco significativo de viés de seleção. Ao escolher propriedades comparáveis, é muito fácil cair na armadilha de selecionar os melhores resultados e assumir que eles são mais parecidos com o seu projeto. Há também uma ênfase na previsão de variáveis, como a taxa de retorno na abordagem de renda. Eliminar a necessidade dessa previsão pode ser atraente para muitos investidores imobiliários, e é por isso que a avaliação baseada em regressão é uma abordagem útil.

Problemas Potenciais com Análise de Regressão

A quantidade de piadas que citam as porcentagens variadas de estatísticas que são inventadas é de fato uma piada em si mesma. Somos bombardeados quase todos os dias com manchetes da mídia sobre os resultados de uma nova pesquisa, muitas das quais parecem contradizer um estudo publicado no ano passado. Em um mundo de soundbites, não há tempo para discutir o rigor dos métodos empregados pelos pesquisadores.

Existem muitos tipos de análise de regressão, mas o mais comum é a regressão linear. Existem certas suposições sobre regressões lineares que não devem ser violadas para considerar o modelo válido. A violação dessas suposições distorce os testes estatísticos que calculam o poder preditivo das entradas e do modelo geral.

Suposições de regressão linear

Deve haver uma relação linear entre as entradas (variáveis ​​independentes) e a saída (variável dependente). Por exemplo, poderíamos supor que existe uma relação linear entre os pés quadrados aquecidos em uma casa e seu valor total. No entanto, devido aos retornos decrescentes, pudemos descobrir que a relação é não linear, exigindo uma transformação dos dados brutos.

exemplo de regressão de relacionamento linear e não linear

As variáveis ​​independentes não devem ser aleatórias. Simplificando, as observações para cada variável independente no modelo são fixas e supõe-se que não haja erro em sua medição. Por exemplo, se estivermos usando o número de unidades para modelar o valor de um prédio de apartamentos, todos os prédios em nossos dados de amostra terão um número fixo de unidades que não mudará, independentemente de como construímos o modelo.

Os “resíduos” do modelo (ou seja, a diferença entre o resultado previsto do modelo e as observações reais) somarão 0, ou em termos mais simples: o modelo que usaremos representará a linha de melhor ajuste.

O modelo deve ser preciso para todas as observações de cada variável independente. Se predêssemos o valor de uma casa com base em sua metragem quadrada, não gostaríamos de usar o modelo se ele fosse extremamente preciso na previsão de valores para casas com menos de 1.500 pés quadrados, mas houvesse uma grande quantidade de erros para casas com mais de 3.000 metros quadrados. pés quadrados. Isso é conhecido como heterocedasticidade.

exemplo de heterocedasticidade e homocedasticidade

Um dos problemas mais comuns com a regressão linear quando se olha para o setor imobiliário é uma correlação de erros residuais entre as observações. Você pode pensar nisso como um ruído branco que não tem padrão. No entanto, se houver um padrão para os resíduos, provavelmente precisamos fazer um ajuste. Esse problema é difícil de conceituar, mas existem duas áreas principais em que isso é uma preocupação no setor imobiliário.

1. Autocorrelação

Construir um modelo baseado em observações durante um longo período de tempo seria inadequado para prever valores atuais. Suponha que construímos um modelo para prever o valor de uma propriedade de hotel usando a tarifa média de quarto como variável independente. O poder preditivo dessa variável pode ser enganoso porque as tarifas dos quartos aumentaram consistentemente ao longo do tempo. Em termos estatísticos, existe uma autocorrelação entre as tarifas médias observadas mostrando uma tendência positiva ao longo do tempo (ou seja, inflação) que não seria contabilizada no modelo. A abordagem tradicional de vendas comparáveis ​​mais amplamente utilizada em imóveis residenciais elimina esse problema usando apenas os dados mais recentes. Como há um número muito menor de transações comerciais, essa restrição de tempo muitas vezes torna ineficaz a abordagem de vendas comparável. No entanto, existem técnicas de regressão linear que podem superar os problemas de autocorrelação.

O efeito cluster também é um desafio significativo na modelagem da avaliação imobiliária. Isso pode ser pensado como autocorrelação espacial. A maneira mais simples de pensar nesse problema é imaginar a construção de um modelo para prever o valor das casas em dois bairros (A e B) de cada lado de uma rodovia. Como um todo, o modelo pode funcionar bem na previsão de valores, mas quando examinamos os erros residuais notamos que há um padrão. As casas do bairro A geralmente estão cerca de 10% sobrevalorizadas, e as casas do bairro B estão cerca de 10% subvalorizadas. Para melhorar nosso modelo, precisamos levar em conta esse efeito de cluster ou construir um modelo para cada vizinhança.

2. Multicolinearidade

Idealmente, as variáveis ​​dentro de um modelo não serão correlacionadas entre si. Esse problema conhecido é chamado de multicolinearidade. Usar tanto o metro quadrado quanto o número de vagas de estacionamento como entradas para um modelo de avaliação de shoppings regionais provavelmente demonstraria multicolinearidade. Isso é intuitivo porque os códigos de planejamento geralmente exigem um certo número de vagas de estacionamento com base na metragem quadrada de um espaço comercial. Neste exemplo, a remoção de uma das variáveis ​​daria uma avaliação mais precisa do modelo ajustado sem reduzir significativamente seu poder preditivo.

outras considerações

O uso de dados observados é o cerne de qualquer abordagem empírica, mas é importante lembrar que os resultados passados ​​nem sempre predizem o futuro. Ativos ilíquidos, como imóveis, são particularmente vulneráveis ​​a mudanças no ciclo de negócios. O poder preditivo de certas variáveis ​​provavelmente mudará com base nas condições econômicas atuais. Esse problema não é exclusivo da regressão linear e encontrado também nas abordagens tradicionais.

Correlação não é igual a causação. O objetivo da construção de modelos é encontrar variáveis ​​úteis que farão previsões válidas. Você deve ter cuidado com correlações espúrias. Você pode se surpreender ao saber que existe uma correlação extremamente forte entre a taxa de divórcio no Maine e o consumo per capita de margarina. No entanto, usar dados de divórcio do Maine não faria sentido se você estivesse tentando prever as vendas futuras de margarina.

Um Exemplo Real de Avaliação de Imóveis por Regressão

Vamos agora aplicar esse conhecimento de forma prática e construir um modelo linear do início ao fim. Para o nosso exemplo, tentaremos construir um modelo de avaliação de imóveis que preveja o valor de casas unifamiliares no condado de Alleghany, Pensilvânia. A escolha do condado de Alleghany é arbitrária e os princípios demonstrados funcionarão para qualquer local. Usaremos Excel e SPSS, que é um software estatístico comumente usado.

Encontrando dados

Encontrar dados de qualidade é o primeiro passo na construção de um modelo preciso e talvez o mais importante. Embora todos nós já tenhamos ouvido a frase “garbage in, garbage out”, é importante lembrar que não existe um conjunto de dados perfeito. Isso é bom, desde que possamos supor confortavelmente que os dados da amostra sejam representativos de toda a população. Existem três fontes principais de dados imobiliários:

  1. A primeira e muitas vezes melhor fonte de dados vem de agências governamentais. Muitos desses dados são gratuitos ou de custo relativamente baixo. Muitas empresas cobram por dados que você pode obter facilmente de graça, então sempre dê uma olhada rápida na internet antes de comprar dados. Uma pesquisa na web geralmente produz resultados pesquisando o condado ou a cidade que você está procurando e palavras como “assessor fiscal”, “avaliações fiscais”, “registros imobiliários” ou “pesquisa de escritura”. Os departamentos de Sistemas de Informação Geográfica (GIS) são uma das partes mais negligenciadas de muitas comunidades. Eles geralmente têm muitos dos dados agregados de várias outras agências locais. Como desenvolvedor imobiliário, muitas vezes contei com a ajuda deles para encontrar dados de alta qualidade que usei para construir modelos para ajudar a localizar novas propriedades para desenvolvimento. As organizações de desenvolvimento econômico também podem ser uma excelente fonte de dados.
  2. Os fornecedores com fins lucrativos são outra opção. Eles são particularmente úteis quando você procura dados em várias áreas. Certifique-se de fazer sua lição de casa antes de pagar grandes somas de dinheiro por seus dados. Não confie apenas em seus conjuntos de dados de amostra, pois isso pode ser enganoso em termos de integridade. Se você estiver em dúvida sobre quais dados eles têm disponível, entre em contato com um representante diretamente ou pergunte sobre uma garantia de devolução do dinheiro.
  3. Finalmente, os Serviços de Listagem Múltipla (MLS) locais são um recurso inestimável. A maioria das propriedades é comercializada através de um agente imobiliário que é membro de um MLS. Geralmente, os membros de um MLS são obrigados a colocar todas as suas listagens no sistema local. Infelizmente, muitas vezes há muitas restrições para ingressar em um MLS, e o custo de acesso a dados pode ser bastante alto. Também é importante garantir que você não viole os termos de serviço ao usar seus dados e se exponha a possíveis responsabilidades.

Usaremos exclusivamente dados gratuitos para nosso exemplo, provenientes do Western Pennsylvania Regional Data Center e do US Census Bureau. Os dados Alleghany Real Estate Sales nos fornecerão um arquivo base para nossas observações com o preço de venda como nossa variável dependente (variável Y). Também testaremos variáveis ​​usando a pontuação de caminhada para cada setor censitário e informações de avaliação fiscal.

Uma variável muito útil para se ter ao construir modelos imobiliários é a latitude e longitude de cada endereço. Você pode obter esses dados por meio de um geocodificador que usa um endereço de rua para atribuir uma latitude e longitude. O geocodificador do US Census Bureau também identificará o setor censitário para cada local que é comumente usado para agregar informações demográficas e psicográficas.

Analisando, transformando e criando novas variáveis.

Agora que selecionamos nossas fontes de dados, precisamos examinar a qualidade dos dados. A maneira mais fácil de verificar a qualidade dos dados é executar uma tabela de frequência para algumas variáveis-chave. Se houver um número significativo de entradas ausentes ou corrompidas, precisaremos examinar melhor os dados. A tabela abaixo mostra que apenas 1 dos 216.498 registros tem um CEP ausente no arquivo de vendas e não há CEPs incorretos como 99999 ou 1X#45. Isso provavelmente indica que este é um conjunto de dados de alta qualidade.

tabela de erros

Um dicionário de dados é um excelente recurso quando disponível. Ele fornecerá uma descrição do que cada variável está medindo e as opções possíveis para a variável. Nossos dados contêm uma análise de cada venda realizada no município. Esta é uma informação importante, especialmente quando se trabalha com registros de escrituras brutas. Todas as transações imobiliárias devem ser registradas para serem executórias por lei, mas nem todas as transferências refletem o verdadeiro valor justo de mercado de uma propriedade. Por exemplo, uma venda entre dois membros da família pode ter um preço abaixo do mercado como forma de presente ou para evitar o pagamento de custos de transação mais altos, como selos de escritura. Felizmente para nós, o governo local marca claramente as transferências que acredita não serem representativas dos valores atuais de mercado, portanto, usaremos apenas registros que reflitam uma “venda válida”. Essas vendas representam apenas cerca de 18% do número total de transações, ilustrando a importância de entender seus dados antes de começar a usá-los para análise. Com base na minha experiência, essa proporção é bastante comum ao analisar registros de escrituras. É muito provável que se construíssemos um modelo incluindo as “vendas inválidas” nossos resultados finais seriam distorcidos.

Em seguida, anexaremos nossos dados de avaliação e pontuações de caminhada ao arquivo de vendas. Isso nos dá uma única tabela para usar em nosso modelo. Neste ponto, precisamos analisar as variáveis ​​para ver se elas são apropriadas para a regressão linear. Abaixo está uma tabela mostrando vários tipos de variáveis.

teste de variável para regressões

Nosso arquivo contém vários valores nominais, como bairro ou CEP, que categorizam os dados sem nenhum sentido de ordem. Os valores nominais são inadequados para regressão linear sem transformação. Existem também várias variáveis ​​ordinais que classificam a qualidade da construção, condição atual do imóvel, etc. O uso de dados ordinais só é apropriado quando podemos razoavelmente supor que cada posto está espaçado uniformemente. Por exemplo, nossos dados têm uma variável de nota com 19 classificações diferentes (A+, A, A-, etc.), então podemos assumir com segurança que essas notas provavelmente estão espaçadas uniformemente.

Existem também várias variáveis ​​que precisam ser transformadas antes que possamos usá-las no modelo. Um valor nominal que pode ser transformado em variável fictícia para teste é a variável de aquecimento e resfriamento. Vamos definir a variável para 0 para todos os imóveis sem ar condicionado e aqueles com ar condicionado para 1. Além disso, as notas das letras precisam ser convertidas em números (por exemplo, 0=Pior, 1=Melhor, 2=Melhor) para ver se houver uma relação linear com o preço.

Finalmente, precisamos determinar se é apropriado usar todas as observações. Queremos prever os valores de residências unifamiliares, para que possamos eliminar todas as propriedades comerciais, condomínios e residências urbanas dos dados. Também queremos evitar possíveis problemas com autocorrelação, por isso só usamos dados de vendas em 2017 para limitar a probabilidade de isso ocorrer. Depois de eliminarmos todos os registros estranhos, temos nosso conjunto de dados final para ser testado.

Seleção de amostra e variável

Selecionar o tamanho de amostra correto pode ser complicado. Entre os materiais acadêmicos, há uma ampla gama de números mínimos sugeridos e várias regras práticas. Para nosso estudo, a população geral é bastante grande, então não precisamos nos preocupar em ter o suficiente para uma amostra. Em vez disso, corremos o risco de ter uma amostra tão grande que quase todas as variáveis ​​terão significância estatística no modelo. Ao final, cerca de 10% dos registros foram selecionados aleatoriamente para modelagem.

A seleção de variáveis ​​pode ser uma das partes mais difíceis do processo sem software estatístico. No entanto, o SPSS nos permite construir rapidamente muitos modelos a partir de uma combinação de variáveis ​​que consideramos apropriadas para uma regressão linear. O SPSS filtrará automaticamente as variáveis ​​com base em nossos limites de significância estatística e retornará apenas os melhores modelos.

Construindo o modelo e revisando os resultados

A partir de nossos dados de amostra, o SPSS produziu cinco modelos. O modelo que foi mais preditivo incluiu as 5 variáveis ​​a seguir.

  1. Nota com base na qualidade da construção classificada de 1 a 19 (1 = Muito ruim e 19 = Excelente)
  2. Área de Estar Acabada
  3. Ar Condicionado (Sim/Não)
  4. Tamanho do Lote
  5. Nota para condição física ou estado de reparo classificado de 1 a 8 (1 = inabitável e 8 = excelente)

Vamos dar uma olhada nos resultados do SPSS. Nosso foco principal será inicialmente no valor R-quadrado que nos diz qual porcentagem de variância na variável dependente (preço) é prevista pela regressão. O melhor valor possível seria 1, e o resultado do nosso modelo é bastante promissor. O erro padrão da estimativa que mede a precisão do modelo parece ser bastante alto em $ 73.091. No entanto, se compararmos isso com o desvio padrão do preço de venda no modelo (US$ 160.429), o erro parece razoável.

Saída de regressão 1

O modelo 5 teve um erro padrão aceitável e passou no teste Durbin-Watson

O SPSS possui funcionalidade integrada para testar a autocorrelação usando o Teste Durbin-Watson. Idealmente, o valor seria 2,0 em uma escala de 0 a 4, mas um valor de 1,652 não deveria causar alarme.

Em seguida, testamos os resultados do modelo para determinar se há alguma evidência de heterocedasticidade. Não há funcionalidade embutida para SPSS, mas usando esta macro escrita por Ahmad Daryanto podemos usar os testes Breusch-Pagan e Koenker. Esses testes mostram que há heterocedasticidade presente em nosso modelo, uma vez que o nível de significância (Sig) no gráfico abaixo está abaixo de 0,005. Nosso modelo violou uma das premissas clássicas da regressão linear. Muito provavelmente, uma das variáveis ​​do modelo precisa ser transformada para eliminar o problema. No entanto, antes de fazermos isso, é uma boa ideia ver quais são os efeitos da heterocedasticidade no poder preditivo de nossas variáveis ​​independentes. Através do uso de uma macro desenvolvida por Andrew F. Hayes, podemos observar os erros padrão ajustados e os níveis de significância para nossas variáveis ​​independentes.

Saída de regressão 2

Há heterocedasticidade presente no modelo, mas outros testes mostram que ela não afeta as variáveis ​​independentes

Testes adicionais revelam que as variáveis ​​independentes permanecem estatisticamente significativas, depois de levar em conta a heterocedasticidade no modelo, então não precisamos necessariamente alterá-lo por enquanto.

Testar e refinar o modelo

Como teste final, pontuaremos todos os registros de vendas que não faziam parte da amostra original com nosso modelo. Isso nos ajudará a ver como o modelo se comporta em um conjunto maior de dados. Os resultados deste teste mostram que o valor R-quadrado e o erro padrão da estimativa não mudaram significativamente no grande conjunto de dados, o que provavelmente indica que nosso modelo funcionará conforme o esperado.

Saída de regressão 3

A aplicação do modelo ao conjunto de dados completo mostra consistência com a amostra, com valores de erro padrão e R-quadrado semelhantes observados

Se quiséssemos usar nosso modelo de exemplo na vida real, provavelmente segmentaríamos ainda mais os dados para ter vários modelos mais precisos ou procurar dados adicionais para aumentar a precisão desse modelo único. Essas etapas provavelmente também removeriam a heterocedasticidade que vimos presente no modelo. Com base no fato de que estávamos tentando usar um único modelo para prever o valor das casas em um município com mais de 1 milhão de pessoas, não deve ser surpresa que não tenhamos conseguido construir o modelo “perfeito” em apenas algumas horas. .

Conclusões

Nosso objetivo foi construir um modelo que preveja o valor de casas unifamiliares unifamiliares. Nossa análise mostra que alcançamos esse objetivo com uma precisão razoável, mas nosso modelo faz sentido?

Se descrevêssemos nosso modelo, diríamos que o valor de uma casa depende do tamanho do lote, da metragem quadrada da casa, da qualidade da construção, do estado atual de conservação e se tem ou não ar condicionado. Isso parece muito razoável. De fato, se compararmos nosso modelo com os métodos tradicionais de avaliação, vemos que é muito semelhante à abordagem de custo, que adiciona o custo de aquisição de terreno e construção de um novo edifício ajustado ao estado atual de obsolescência. No entanto, essa semelhança pode ser, para usar uma frase de regressão, uma correlação espúria.

Normalmente, a abordagem de custo é recomendada apenas para avaliar imóveis mais novos, devido a problemas com a determinação do método apropriado para depreciação de imóveis mais antigos. Com nosso modelo, criamos uma estratégia semelhante que é útil para imóveis de qualquer idade, de fato, testamos a idade como variável independente e concluímos que ela não tem impacto estatisticamente significativo no valor dos imóveis!

Usando a análise de regressão para o seu negócio

Espero que agora você tenha uma melhor compreensão dos fundamentos da análise de regressão. A próxima pergunta é: isso pode ajudar o seu negócio? Se você responder sim a qualquer uma dessas perguntas, provavelmente poderá se beneficiar do uso da análise de regressão como ferramenta.

  1. Você quer uma abordagem mais científica para determinar valor, fazer projeções ou analisar um mercado específico?
  2. Você está procurando melhores maneiras de identificar potenciais investimentos imobiliários em grandes áreas, regiões ou mesmo em todo o país?
  3. Seu objetivo é atrair grandes varejistas, restaurantes ou empresas de hospitalidade para seu projeto imobiliário comercial?
  4. Você acha que poderia melhorar seu processo de tomada de decisão incorporando novos pontos de dados ao processo?
  5. Você está preocupado com o retorno do seu investimento em marketing para compradores e investidores?

O modelo de exemplo acima é uma demonstração simples do valor do uso de modelagem de regressão em imóveis. As 2-3 horas necessárias para coletar os dados e construir o modelo estão longe de mostrar todo o seu potencial. Na prática, há uma grande variedade de usos para análise de regressão no setor imobiliário, além da avaliação de propriedades, incluindo:

  1. Análise de preços para preços de tabela e taxas de aluguel
  2. Análise demográfica e psicográfica de compradores e inquilinos residenciais.
  3. Identificando alvos para marketing direto
  4. Análise de ROI para campanhas de marketing

A modelagem geoespacial usa os princípios da análise de regressão combinados com as três coisas mais importantes no setor imobiliário: localização, localização, localização. Trabalhando como desenvolvedor residencial por oito anos, posso atestar o poder da modelagem geoespacial. Usando o ArcGIS, consegui incorporar dados de vendas, mapas de lotes e dados lidar para encontrar propriedades ideais para desenvolvimento nas montanhas da Carolina do Norte.

Com base na minha experiência, a maior parte do dinheiro em imóveis é feito na aquisição e não no desenvolvimento de um projeto. Ser capaz de identificar oportunidades que outros perdem pode ser uma tremenda vantagem competitiva no setor imobiliário. A análise geoespacial é algo que as grandes empresas aproveitam há muitos anos, mas as empresas menores geralmente ignoram.

Como identificar o parceiro de análise certo para o seu negócio

Muito poucas pessoas classificariam estatísticas como seu assunto favorito. Na verdade, como um todo, as pessoas são muito ruins em entender até probabilidades básicas. Se você duvida dessa opinião, faça uma viagem a Las Vegas ou Macau. Infelizmente, isso pode dificultar a determinação em quem confiar quando você procura conselhos sobre como implementar a análise de regressão em seu processo. Aqui estão algumas coisas importantes a serem observadas ao avaliar potenciais candidatos

Enquanto as pessoas são ruins em julgar probabilidades, a intuição é realmente muito boa em detectar mentiras. Você deve ser muito cético em relação a qualquer pessoa que afirme ser capaz de construir um modelo que responda a todas as suas perguntas! Não confie em uma garantia de resultados. Felizmente, este artigo ilustrou o fato de que a análise de regressão é baseada em observação empírica e ciência sólida. Sempre será o caso de certas coisas serem mais fáceis de prever do que outras. Um consultor de confiança será aberto e honesto quando não conseguir encontrar as respostas que você está procurando e não gastará seu orçamento tentando encontrar uma que não esteja lá.

Procure o Sr. Spock em vez do Capitão Kirk. Uma boa pesquisa pode ser uma excelente ferramenta de marketing, mas muitas vezes as pessoas pagam por materiais de marketing sensuais com um toque de pseudopesquisa e sem lógica para apoiá-la. Algumas pessoas são naturalmente mais analíticas, mas grandes habilidades analíticas vêm da prática. Idealmente, qualquer pessoa que você contrate para analisar dados para sua empresa terá experiência em encontrar soluções para uma ampla variedade de problemas. Alguém com um foco estreito pode ser mais suscetível ao pensamento de grupo, especialmente quando suas experiências espelham as suas.

Put potential candidates on the spot with questions that help demonstrate their reasoning abilities. This is not the time to rely on behavioral questions alone. Ideal candidates will have the ability to strategically use known information to reasonably estimate the answer to complex problems. Ask logical reasoning questions, like “How many tennis balls could you fit in the Empire State Building?”

Finally, you should look for someone with whom you can communicate. All of the information in the world won't help if you can't put it to good use. If someone uses so much jargon in an introductory conversation that your eyes start to glaze over, then they probably aren't the right fit for your company.