brunaaaz commited on
Commit
18939a9
·
verified ·
1 Parent(s): 3c3f809

Update README.md

Browse files
Files changed (1) hide show
  1. README.md +15 -39
README.md CHANGED
@@ -12,47 +12,23 @@ short_description: Streamlit template space
12
  license: mit
13
  sdk_version: 1.51.0
14
  ---
15
- # 🏨 Dashboard de Previsão de Cancelamentos Hoteleiros
16
 
17
- ## 📋 Sobre o Projeto
18
 
19
- Este dashboard interativo foi desenvolvido para prever a probabilidade de cancelamento de reservas hoteleiras utilizando técnicas de Machine Learning. A ferramenta permite comparar três algoritmos de classificação e fornece insights valiosos para ações preventivas.
 
 
 
20
 
21
- ## 🎯 Objetivos
22
 
23
- - **Previsão Preditiva**: Identificar reservas com alta probabilidade de cancelamento
24
- - **Análise Comparativa**: Avaliar desempenho de diferentes algoritmos de ML
25
- - **Tomada de Decisão**: Fornecer recomendações baseadas em dados para:
26
- - Overbooking controlado
27
- - Ofertas promocionais direcionadas
28
- - Políticas de retenção de clientes
29
 
30
- ## 🛠️ Funcionalidades
31
-
32
- ### 🤖 Algoritmos Implementados
33
- 1. **Regressão Logística** - Modelo linear probabilístico
34
- 2. **K-Nearest Neighbors (KNN)** - Modelo baseado em distância
35
- 3. **Support Vector Machine (SVM)** - Modelo baseado em separabilidade
36
-
37
- ### ⚙️ Configurações Interativas
38
- - Ajuste de hiperparâmetros específicos por algoritmo
39
- - Seleção de métricas de distância (KNN)
40
- - Escolha de kernel (SVM)
41
- - Configuração de validação cruzada
42
- - Opção de balanceamento com SMOTE
43
-
44
- ### 📊 Visualizações
45
- - Matriz de Confusão
46
- - Curva ROC e AUC
47
- - Métricas de desempenho comparativas
48
- - Análise de importância de características
49
-
50
- ## 🚀 Como Usar
51
-
52
- ### Execução Local
53
- ```bash
54
- # Instalar dependências
55
- pip install -r requirements.txt
56
-
57
- # Executar o dashboard
58
- streamlit run app.py
 
12
  license: mit
13
  sdk_version: 1.51.0
14
  ---
15
+ ## 📊 Fonte de Dados
16
 
17
+ O dashboard utiliza o dataset **Hotel Booking Demand** do Kaggle:
18
 
19
+ - **Dataset**: [Hotel Booking Demand](https://www.kaggle.com/jessemostipak/hotel-booking-demand)
20
+ - **Registros**: +100,000 reservas hoteleiras
21
+ - **Período**: 2015-2017
22
+ - **Variável Alvo**: `is_canceled` (indicador de cancelamento)
23
 
24
+ ### Estratégia de Carregamento
25
 
26
+ 1. **Dataset Real (Prioridade)**:
27
+ - Download automático via `kagglehub`
28
+ - Fallback para arquivo local `hotel_bookings.csv`
29
+ - Fallback para dataset alternativo
 
 
30
 
31
+ 2. **Dados Sintéticos (Fallback)**:
32
+ - Gerados programaticamente
33
+ - Mantêm estrutura e padrões do dataset real
34
+ - Garantem funcionamento mesmo sem acesso ao Kaggle