Carros e Renda em Sao Paulo

Este post analisa a relação entre a posse de automóveis e a renda domiciliar usando dados da Pesquisa Origem e Destino do Metrô de 2017. Um modelo de escolha discreta revela um impacto significativo da renda na decisão de possuir um carro. Idade, educação e filhos também são fatores importantes e que aumentam a probabilidade do domicílio ter um automóvel. O único fator encontrado que reduz a probabilidade do domicílio ter um automóvel é ele ser chefiado por uma mulher.
data-science
sao-paulo
transporte
Author

Vinicius Oike

Published

January 15, 2024

Carros e Renda

Este post investiga a relação entre a “demanda por automóveis”, entendida simplesmente como a posse (ou não) de um automóvel. Usando dados da Pesquisa Origem e Destino do Metrô de 2017, estima-se um modelo de escolha discreta para investigar o efeito da renda domiciliar sobre a escolha de ter um carro. Encontrou-se um efeito forte e significante da renda sobre a “demanda” por carros. Idade, educação e filhos também são fatores importantes e que aumentam a probabilidade do domicílio ter um automóvel. O único fator encontrado que reduz a probabilidade do domicílio ter um automóvel é ele ser chefiado por uma mulher.

Vale notar que não se pode falar propriamente em “demanda” por automóveis já que temos somente dados de um único momento no tempo. Eventualmente, quando os dados da POD 2022 forem liberados, será possível construir uma curva de demanda por automóveis.

São Paulo: fatos gerais

A Região Metropolitana de São Paulo abriga aproximadamente 20 milhões de pessoas e gera mais de 40 milhões de viagens todos os dias. Segundo Relatório do Metrô as viagens na Região Metropolitana de São Paulo dividem-se da seguinte maneira: um terço das viagens é feita por modos não-motorizados (a pé ou de bicicleta), enquanto dois terços das viagens é feito por modos motorizados. Neste último grupo, 55% das viagens são feitas com modais coletivos (ônibus, metrô, trem) e 45% das viagens são feitas com modais individuais (carro, táxi, moto). Ao todo, as viagens em automóveis particulares (excluindo táxis) representam cerca de 27% de todas as viagens diárias; ou seja, cerca de 1 em cada 4 viagens na RMSP é feita com carro particular.

O diagrama abaixo esquematiza todas as viagens diárias realizadas na RMSP. Vale notar que os dados são de 2017, então muitas das estações das linhas 4-amarela e 5-coral ainda estavam sob construção. Similarmente, as linhas 13-Jade, 15-Prata (monotrilho) ainda não estavam operando. Por simplicidade considerei o universo de todas as viagens: ainda que os deslocamentos casa-trabalho componham a maior parte deste conjunto, inclui-se todo tipo de deslocamento.

Carros por domicílio

Pouco mais da metade dos domicílios na RMSP possui algum automóvel: 53% dos domicílios possui ao menos um carro, enquanto 47% dos domicílios não possui carro particular. Mais especificamente, 43,8% possui somente um carro. Domicílios com 2 automóveis são apenas 8% do total e domicílios com 3 automóveis ou mais são pouco mais de 1% do total.

Na média da RMSP, há 0,635 carros por domicílios. Na capital, o número é similar, 0,6. Olhando para os distritos de São Paulo, vê-se que os menos “carro-dependentes” são distritos centrais como República e Sé. Distritos de baixa renda média como Parelheiros e Cidade Tiradentes também tem uma baixa razão de carros por domicílio.

Os distritos mais carro-dependentes têm rendas elevadas e estão dentro ou próximos do Centro Expandido da cidade. É curioso notar que bairros verticalizados como Moema e Morumbi aparecem junto com o distrito de Alto de Pinheiros que é majoritariamente composto por residências horizontais. Isto sugere que a verticalização não acompanha menor dependência do automóvel particular.

O mapa abaixo mostra a taxa de motorização, a razão de carros por domicílios, nos distritos da RMSP. Vê-se um padrão espacial onde as regiões com maiores taxas de motorização concentram-se no quadrante sudoeste do Centro Expandido da capital. No começo da zona oeste, na região do Tatuapé, também vê-se taxas mais elevadas. Fora da capital, vale notar que a cidade de Santana de Parnaíba tem elevada taxa de motorização, comparável aos distritos mais carro-dependentes de São Paulo.

O share de domicílios sem carro segue um padrão espacial similar. O mapa detalha as zonas OD da cidade de São Paulo. Em outro post, discuti a distribuição desta métrica na cidade.

Carros por domicílio e renda

A demanda por automóveis tende a aumentar junto com a renda das famílias. Mesmo famílias que moram em regiões centrais, próximas de polos de empregos e com boa oferta de infraestrutura urbana, preferem ter mais automóveis. O gráfico abaixo mostra a relação entre a renda domiciliar média e a razão de carros por domicílio; os dados são agregados por zona OD. A linha de tendência mostra uma relação quadrática ponderada (usando a população total de cada zona como peso).

É interessante notar as zonas que “fogem” da tendência esperada. A região do Morumbi, por exemplo, tem renda similar a do Paraíso, mas tem uma taxa de motorização consideravelmente melhor. Possivelmente, isto reflete a infraestrutura de cada bairro: o Morumbi não tem acesso fácil nem a trem e nem a metrô; já o bairro do Paraíso tem acesso fácil a duas linhas de metrô, ciclovias e corredores de ônibus.

RMSP e Centro Expandido

A demanda por automóveis também parece variar por região. O gráfico abaixo agrupa as zonas por regiões: Centro Expandido, São Paulo (capital) e RMSP (resto da região metropolitana). Nota-se que as zonas dentro do CE da capital tem uma tendência a ter menos carros do que regiões de renda equivalente na RMSP.

Note que agora os gráficos agora mostram a renda domiciliar per capita em escala logarítmica e usa-se uma tendência linear. A regressão continua sendo ponderada pela população total de cada zona, mas todos os círculos no painel da direita tem igual tamanho para facilitar a visualização dos dados.

Regressão linear

Indo um pouco mais a fundo, pode-se fazer uma regressão linear para melhor avaliar a diferença entre os grupos. Visualmente, as zonas dentro do CE parecem ter uma proporção menor de carros por habitante do que as zonas na RMSP, relativamente à renda familiar. A tabela abaixo mostra o resultado da regressão, onde adiciona-se também algumas variáveis auxiliares como a proporção de adultos (18-64 anos) que habita na zona e a densidade populacional da zona.

A relação de interesse aparece nas duas últimas linhas que indica a relação entre a renda domiciliar per capita e a localização (estrato) para a proporção de carros por domicílio. Tanto regiões dentro da capital como dentro do CE apresentam uma menor proporção de carros por domicílios, relativamente às zonas da RMSP.

Characteristic Beta 95% CI1 p-value
Prop. Adultos (%) -0.00298 -0.00762, 0.00166 0.2
Densidade Populacional -0.00058 -0.00076, -0.00040 <0.001
Prop Ensino Superior (%) 0.00026 -0.00229, 0.00280 0.8
Renda Domiciliar per capita (log) 0.54064 0.45712, 0.62415 <0.001
Estrato
    RMSP
    São Paulo 0.49744 -0.07001, 1.06489 0.086
    Centro Expandido 0.55672 -0.34798, 1.46142 0.2
Renda Domiciliar per capita (log) * Estrato
    Renda Domiciliar per capita (log) * São Paulo -0.07532 -0.15368, 0.00303 0.060
    Renda Domiciliar per capita (log) * Centro Expandido -0.10456 -0.22138, 0.01227 0.079
0.664
Adjusted R² 0.658
AIC -464
Sigma 25.1
Log-likelihood 242
1 CI = Confidence Interval

Visualmente, pode-se verificar isto no gráfico abaixo que mostra a relação entre a renda domiciliar per capita e a “demanda por automóveis” em cada um dos estratos geográficos.

Zonas

O mapa abaixo apresenta visualmente a relação entre renda e a taxa de automóveis. A classificação das zonas é simples e segue o algoritmo de Jenks sem considerar explicitamente a dependência espacial entre as zonas. Ainda assim, é possível distinguir entre as regiões. A região da Paraíso, por exemplo, é de renda alta e taxa de motorização média; Pinheiros é de renda média e taxa de motorização média; e Jardim Europa é de renda alta e taxa alta. Algumas regiões do Centro-Sul como Brooklin e Campo Belo são médio-alto (renda média e taxa alta). O centro antigo da cidade é baixo-baixo, assim como boa parte da periferia da cidade.

A maior parte das zonas classificadas é do tipo “low-low”, isto é, de renda baixa e de baixa razão carros/domicílios. De fato, quase metada das zonas entra no grupo de “renda baixa” (R$2000 a R$4500). Dentre as zonas de renda alta (> R$ 8000), a maior parte tem uma razão alta de carros/domicílio; ainda assim, uma proporção relativamente expressiva têm razão média de carros/domicílios (36%). Apenas duas zonas (MASP e Rodrigues Alves) são classificados como renda alta e baixa razão carros/domicílios.

Renda - Carros Número de Zonas Proporção de zonas
Low-Low 175 35.57%
Medium-Medium 114 23.17%
Low-Medium 63 12.80%
High-High 52 10.57%
Medium-Low 42 8.54%
High-Medium 31 6.30%
Medium-High 13 2.64%
High-Low 2 0.41%

A tabela abaixo ilustra a classificação acima trazendo alguns exemplos de cada grupo.

Renda - Carros Exemplos de Região
Low-Low Cascatas, Morro do Índio, Sacadura Cabral, Itapevi, Jardim Presidente Dutra
Low-Medium Estrada do Carneiro, Riacho Grande, Taboão, Melhoramentos, Cotia
Medium-Low Penha, Vila São Rafael, Quarta Parada, Jardim Primavera, Belenzinho
Medium-Medium Jardim Piratininga, Vila Miranda, Itaquera, Vila Esperança, Vila Zelina
Medium-High Vila Bertioga, Rudge Ramos, Parque da Mooca, Granja Viana, Bosque da Saúde
High-Low Masp, Rodrigues Alves
High-Medium Bela Vista, Vila Sônia, Chácara Itaim, Alfredo Pujol, Vila Clementino
High-High Santa Cruz, Parque Ibirapuera, Gavião Peixoto, Santo Amaro, Vila Nova Conceição

Carros e renda: analisando a relação

Até agora este post assumiu que o deslocamento total de carro de uma família é, de alguma forma, proporcional ao número de automóveis que ela possui. Isto é, o número total de quilômetros rodados em automóvel particular é uma função da posse do automóvel.

Esta é uma hipótese razoável, mas como viu-se acima, a maioria dos domicílios ou não têm um carro ou tem somente um. Assim, é possível fazer ainda mais uma simplificação: considerar a posse ou não de um automóvel (ou mais).

Análise visual

Há dois fatores bastante intuitivos, indicados pela literatura, que estão relacionados com a posse de automóvel: renda e idade. O gráfico abaixo mostra a relação entre a posse de automóveis e a idade do chefe da família. Como se vê, há uma relação não-linear entre as variáveis: a proporção de famílias com automóvel cresce até certo ponto e depois diminui.

Os pontos agrupam as idades em grupos de cinco anos (18-22, 23-27, etc.) e representam a média de cada grupo. A linha de ajuste é de uma regressão polinomial de segundo grau, ajustada pelo peso proporcional da cada grupo na população total.

O gráfico de colunas abaixo mostra a proporção de domicílios que possui ao menos um carro por decil de renda. Abaixo dos eixos, apresenta-se o intervalo de renda considerado. As barrinhas pequenas são o intervalo de confiança de cada estimativa.

Regressão simples

Como agora temos uma variável binária (posse ou não-posse de automóvel) pode-se usar um modelo de escolha discreta para estudar a relação entre renda e automóveis. Na regressão abaixo, mostro os resultados de uma regressão Logística e de uma regressão Probit. A regressão é feita sobre os microdados da Pesquisa Origem Destino (identificados por domicílio) usando os fatores de expansão como pesos.

Para simplificar a análise, restringiu-se a amostra às zonas dentro da cidade de São Paulo (capital). Além disso, removeu-se domicílios com renda muita baixa (menos de 1/4 do salário mínimo da época) e domicílios chefiados por um responsável com menos de 18 anos. Esta regressão inclui algumas variáveis adicionais relevantes:

  • Criança: variável binária que indica se há pelo menos uma criança no domicílio (menor de 18 anos com vínculo familiar)

  • Ensino superior: variável binária que indica se o responsável pelo domicílio possui ensino superior.

  • Empregado: variável binária que indica se o responsável pelo domicílio estava empregado.

  • Feminino: variável binária que indica se a responsável pelo domicílio se identifica como do sexo feminino.

  • Centro Exp: variável binária que indica se a zona do domicílio se encontra dentro do Centro Expandido da cidade.

  • A variável de idade foi “discretizada” em grupos para melhor capturar o seu efeito não-linear.

A tabela abaixo ilustra o efeito das variáveis binárias acima sobre a frequência de domicílios em relação à posse de automóveis. A tabela soma o número de domicílios com ou sem automóvel e compara as famílias com e sem crianças. Proporcionalmente, as famílias com ao menos um filho tem uma chance cerca de 1,5 maior de ter um carro (em contraste com uma família sem filhos).

Para levar em consideração o efeito espacial das variáveis incluiu-se efeitos fixos de cada zona OD. Existem métodos mais sofisticados para modelar a dependências espacial entre as regiões, mas para os propósitos deste post esta abordagem é suficiente. Os resultados das duas regressões é apresentado abaixo.

Vale notar que apresento os odd-ratios ao invés dos coeficientes na regressão logística1. Assim, pode-se ver mais imediatamente o efeito das variáveis. De maneira geral, todos os fatores tem efeito de aumentar a chance que um domicílio tenha um automóvel; apenas “Feminino” e “Centro Exp.” têm valores menores do que um, indicando que domicílios chefiados por mulheres e/ou dentro do CE têm uma chance menor de ter automóvel. Um domicílio que recebe incremento de 1% na sua renda tem um aumento de 6,74% na chance de ter um carro. Similarmente, um domicílio com criança tem um aumento de 1,33 na chance de ter um carro em relação a um domicílio sem criança.

A interpretação dos coeficientes de uma regressão Probit não é tão imediato. Vale notar que o sinal de todos os coeficientes corrobora o modelo Logit: com exceção de “feminino”, todas as variáveis têm efeito positivo, isto é, aumentam a probabilidade do domicílio possuir um automóvel.

O gráfico abaixo simula a probabilidade esperada de um domicílio de Pinheiros chefiado por um indivíduo de 35 a 44 anos possuir um automóvel, condicional a alguns fatores:

    1. Criança. Se a família possui pelo menos um filho no domicílio.
    2. Ensino Universitário. Se a pessoa responsável pelo domicílio possui ensino supeior.
    3. Renda. O nível de renda domiciliar (ajustado pelo IPC-Fipe).

Em todos os casos analisados, ter um filho aumenta a probabilidade de ter um automóvel, mas este efeito varia de acordo com a renda.

Referências

Footnotes

  1. Isto é equivalente a tomar a exponencial do coeficiente. Isto é, ao invés de mostrar \(\beta\) mostra-se \(exp(\beta)\).↩︎