Enc. 12 — Regressão Logística (binária e ordinal)

statsmodels Logit() · mord · sklearn ROC/AUC


📊 Slides


🍊 Metáfora

Imagine isso…

Para prever engajou ou não engajou, a logística usa uma sigmoid que espreme valores em [0, 1] — probabilidade. Coeficientes como odds ratios: OR = 2 significa chances dobradas. A curva ROC mede a qualidade do modelo (AUC).


🎯 Para que serve

Modelar desfechos categóricos: binária (engajou/não) ou ordinal (baixo/médio/alto).


📋 Quando usar

  • Binária: duas categorias mutuamente exclusivas.
  • Ordinal: 3+ categorias ordenadas.
  • ✅ AUC > 0.70 aceitável · > 0.80 bom · > 0.90 excelente.
  • ❌ Não use regressão linear para desfecho binário.

🐍 Exemplo Python

🐍 Python executável no navegador via Pyodide

📚 Referências

   
referência Hosmer, D. W., Lemeshow, S., & Sturdivant, R. X. (2013). Applied Logistic Regression (3ª ed.).
didático Field, A. (2024). Discovering Statistics. Cap. 20.
ROC Fawcett, T. (2006). An introduction to ROC analysis. Pattern Recognition Letters, 27(8), 861–874.
ordinal McCullagh, P. (1980). Regression models for ordinal data. JRSS B, 42(2), 109–142.

Rodrigo Prestes Machado
CC BY 4.0 DEED