Enc. 11 — Regressão Linear (simples e múltipla)

statsmodels.formula.api.ols() · sklearn LinearRegression


📊 Slides


🍊 Metáfora

Imagine isso…

A regressão traça a linha reta que erra menos para todos os pontos. A múltipla adiciona dimensões: cada coeficiente é o efeito único da variável, mantendo as outras constantes.


🎯 Para que serve

Modelar e predizer um desfecho numérico contínuo a partir de preditores.


📋 Quando usar

  • ✅ Desfecho numérico contínuo.
  • ✅ Relação linear entre preditores e desfecho.
  • ✅ Resíduos normais e homocedásticos.
  • ✅ VIF > 5 indica multicolinearidade.
  • ❌ Para inferência científica use statsmodels; para ML use sklearn.

🐍 Exemplo Python

🐍 Python executável no navegador via Pyodide

📚 Referências

   
referência Hair, J. F., et al. (2019). Multivariate Data Analysis (8ª ed.). Cap. 4.
didático James, G., et al. (2023). An Introduction to Statistical Learning (2ª ed.). Cap. 3.
VIF O’Brien, R. M. (2007). A caution regarding rules of thumb for VIF. Quality & Quantity, 41, 673–690.
python McKinney, W. (2022). Python for Data Analysis.

Rodrigo Prestes Machado
CC BY 4.0 DEED